Betrouwbaarheidsinterval

From Wikistatistiek
Jump to navigation Jump to search
Auteur dr. ir. N. van Geloven
Co-Auteur
auteurschap op deze site

Het betrouwbaarheidsinterval (Engels confidence interval (CI)) wordt gebruikt om aan te geven hoe zeker je bent van een geschatte waarde. Het is een interval waar binnen je verwacht dat de werkelijke waarde ligt. Formeel zegt het interval iets over welke waardes verwacht worden als een experiment meerdere keren herhaald zou worden. Vaak wordt het 95% betrouwbaarheidsinterval gebruikt. Hiermee zeg je eigenlijk: stel ik zou mijn onderzoek 100 maal herhalen, dan verwacht ik dat de werkelijke waarde (parameter) minstens 95 keer binnen het (voor ieder onderzoek apart opgestelde) 95% betrouwbaarheidsinterval ligt.

Wanneer gebruik ik een betrouwbaarheidsinterval?

Je kunt een betrouwbaarheidsinterval gebruiken bij iedere schatting die je maakt. Bijvoorbeeld: als ik van een groep patienten het gemiddelde gewicht gemeten heb, dan kan ik het gemiddelde gewicht van de hele patientpopulatie schatten middels door het gemiddelde van mijn steekproef te nemen en de zekerheid van deze schatting aangeven met een betrouwbaarheidsinterval.

Vaak wordt er in het medisch onderzoek een betrouwbaarheidsinterval gegeven rondom de schatting van een bepaald effect (of een bepaald verschil tussen groepen). Bijvoorbeeld: "women receiving treatment were less likely to report severe pain (risk ratio 0.41, 95% confidence interval 0.32 to 0.55)".

Welke software is er voor het berekenen van betrouwbaarheidsintervallen?

In de meeste statistische pakketten kun je aangeven dat je de resultaten van een analyse met bijbehorend betrouwbaarheidsinterval wilt zien. Het programma CIA, behorend bij het boek "Statistics with confidence" is helemaal gewijd aan het berekenen van betrouwbaarheidsintervallen. Er is een versie van CIA te downloaden vanaf de CRU website onder Tools (AMC intranet).

Hoe bereken ik een betrouwbaarheidsinterval rondom een incidence rate?

Ik heb nu de death rate per 1000y berekend, door het totaal aantal overledenen te delen door de som aantal jaren follow up (persoonsjaren). Graag zou ik bij deze death rate een 95% CI willen berekenen in SPSS. Kan dit?

Ik ken geen methode om deze confidence intervallen in SPSS uit te rekenen. De manier waarop dit kan staat op de site van StatsDirect Ltd beschreven. Je kunt dit zelf implementeren (in bijv excel, of R), maar je kunt ook gebruik maken van bestaande implementaties. De nieuwere versies van het programma CIA heeft opties hiervoor en ook op de website OpenEpi vind je onder 'Person Time' opties.

Welke betrouwbaarheidsintervallen horen er bij de toetsen die ik gedaan heb?

In mijn onderzoek voer ik een Chi-square test, Mann-Whitney test en een Kaplan-Meier analyse uit om twee groepen met elkaar te vergelijken. In de eerste versie van mijn artikel had ik de p-waarden gerapporteerd. Omdat we slechts een beperkt aantal deelnemers hebben stelde één van mijn co-auteurs voor om ipv de p-waarde het 95%-betrouwbaarheidsinterval te rapporteren. Naar mijn idee kan ik dit interval bij bovengenoemde testen in SPSS echter niet uit de analyses krijgen. Klopt dit? Hebben jullie ideeën over hoe ik de intervallen wel kan verkrijgen?

Een 95% betrouwbaarheidsinterval kun je berekenen rondom een ‘effect maat’. Voor ieder van de genoemde vergelijkingen zou je dan moeten gaan kiezen welke effectmaat je wilt rapporteren en daarbij het betrouwbaarheidsinterval uitrekenen.

- Bij een Chi-kwadraat toets (het vergelijken van proporties) kun je denken aan een risk difference, risk ratio of odds ratio. De laatste 2 kun je inclusief betrouwbaarheidsinterval opvragen in de crosstabs procedure van SPSS (vink ‘risk’ aan, let wel goed op welke groep als referentie gekozen wordt). Een risk difference wordt volgens mij niet aangeboden in de crosstabs procedure. Je zou die bijv kunnen verkrijgen via de ‘two by two table’ calculator op de OpenEpi website . Of met CIA.

- bij een Mann-Whitney U toets kun je denken aan het rapporteren van de betrouwbaarheidsintervallen rondom de twee medianen van beide groepen en een geschat verschil tussen de medianen + betrouwbaarheidsinterval. Volgens mij geeft SPSS voor die laatste geen optie. Je zou dit ook via CIA kunnen berekenen.

- Kaplan Meier analyse: indien je daar alleen een (of meerdere) survival curves mee plot, dan ligt het voor de hand dat je een 95% betrouwbaarheidsinterval rondom het geschatte survival (of event) percentage rapporteert. SPSS geeft dat voor bijv mean en median survival (indien deze beide berekend kunnen worden). Voor de curve zelf geeft SPSS niet een betrouwbaarheidsinterval. Dit zou je eventueel kunnen berekenen met R, functie survfit. Wellicht ben je meer geintersseerd in een schatting van het verschil in termen van ratio tussen 2 curves op een bepaald punt. Dat zou je eventueel zelf mbv de standaard errors die SPSS geeft + een delta methode aanpassing kunnen berekenen.

Referenties

Klaar met lezen? Je kunt naar het OVERZICHT van alle statistische onderwerpen op deze wiki gaan of naar de pagina KEUZE TOETS voor hulp bij het uitzoeken van een geschikte toets of analyse. Wil je meer leren over biostatistiek? Volg dan de AMC e-learning Practical Biostatistics. Vind je op deze pagina's iets dat niet klopt? Werkt een link niet? Of wil je bijdragen aan de wiki? Neem dan contact met ons op.

De wiki biostatistiek is een initiatief van de helpdesk statistiek van Amsterdam UMC, locatie AMC. Medewerkers van Amsterdam UMC, locatie AMC kunnen via intranet ondersteuning aanvragen. Ondersteuning aan studenten of derden is niet mogelijk!