Meta-analyse

From WikiStatistiek
Jump to: navigation, search

In een meta-analyse worden resultaten of data van verschillende studies samengevoegd om tot een meer betrouwbare uitspraak te komen [1]. Als je overweegt om een meta-analyse uit te voeren, is het belangrijk om te beseffen dat je geavanceerd statistische technieken nodig hebt. Het is aan te raden om hiervoor ten minste een inleidende cursus statistiek en het liefst ook een geavanceerde cursus of een cursus specifiek gericht op meta-analyse te volgen.

Wat is het verschil tussen een meta-analyse en een systematic review?

De term 'systematic review' heeft vooral van doen met het systematisch literatuur zoeken, beoordelen en beschrijven. Een meta-analyse is een statistische analyse waarbij de, meestal samengevatte, resultaten van verschillende studies gecombineerd worden tot een 'overall' resultaat. Dit heeft dus meer te maken met het doen van bepaalde berekeningen waarbij de resultaten van ieder van de gevonden studies input is. Soms worden de studieresultaten van verschillende studies gecombineerd waarbij er van iedere studie niet de samengevatte resultaten als input dienen, maar waarbij er van iedere studie van iedere patiënt informatie is. Het poolen van dergelijke per-patiënt data wordt aangeduid als een 'individual patient data' meta-analyse. Het tutorial artikel How to do a meta-analysis [1] geeft stap voor stap aan hoe je een meta-analyse uitvoert.

Welke software kan ik gebruiken om een meta-analyse uit te voeren?

Er zijn opties in diverse softwarepakketten om de berekeningen uit te voeren.

Ik wil de prevalentie (1 arm) over verschillende studies poolen, welke software is hiervoor beschikbaar?

Je kunt deze analyse uitvoeren in R gebruik makend van de metaprop functie uit de package meta.

Hoe kan ik de gemiddelde en standaard deviatie van een behandel- en een controlegroep poolen om de gemiddelde en standaard deviatie van beide groepen samen te krijgen?

Voor een review wil ik voor een overzicht van de geconcludeerde artikelen de gemiddelde en standaard deviatie van de gehele studie populatie beschrijven. In de artikelen staat echter vaak een aparte gemiddelde en standaard deviatie voor de behandel- en een voor de controlegroep. Hoe kan ik hiermee een gemiddelde en standaard deviatie van de gehele studiepopulatie berekenen?

Stel we noemen de gemiddelde en standaard deviatie van de controlegroep m_1 en s_1 en de mean en standaard deviatie van de behandelgroep m_2 en s_2. Zeg dat de controle groep n_1 patiënten bevat en de behandelgroep n_2. De gemiddelde van de twee groepen samen m is dan simpel een gewogen gemiddelde van de twee gemiddelden:

m = \frac{(n_1*m_1+n_2*m_2)}{(n_1+n_2)}

Voor het berekenen van de gepoolde standaarddeviatie is meer nodig. Hiervoor kun je de volgende formules aanhouden. Het is hierbij belangrijk om te weten dat de variantie gelijk is aan de standaard deviatie in het kwadraat, oftwel \operatorname{Var}_{1}=s_{1}^{2} en \operatorname{Var}_{2}=s_{2}^{2}. Dan is


\operatorname{Var} = \frac{(n_{1}*\operatorname{Var}_{1}+n_{2}*\operatorname{Var}_{2}+n_{1}*(m_{1}-m)^{2}+n_{2}*(m_{2}-m)^{2})}{(n_{1}+n_{2})}

Tenslotte kan je de standard deviatie van beide groepen samen, s krijgen door de wortel te nemen: s = \sqrt{\operatorname{Var}}.

Hoe kan ik twee gepaarde gemiddeldes beschreven in verschillende studies vergelijken?

Voor een systematic review over een bepaalde chirurgische ingreep heb ik data verzameld uit 5 publicaties. Door deze ingreep neemt de hypertrofie, uitgedrukt in gram, een continue variabele af. In deze 5 studies is de gemiddeld preoperatieve hypertrofie bekend met een standaard deviatie. Ook de gemiddelde hypertrofie na follow-up is bekend, ook met standaard deviatie. Alle studies laten een afname in de gemiddelde hypertrofie zien na de ingreep. Nu vragen wij ons af of het mogelijk is om aan te geven of de afname significant is. Ik denk dat ik de ruwe data zou moeten hebben zodat ik een paired t-test kan doen. De ruwe data heb ik echter niet. Hoe kan ik de afname gerapporteerd in de verschillende studies testen?

Om hier een formele toets op te kunnen doen, is er naast de gemiddelde + sd preoperatief en na follow up inderdaad nog extra informatie nodig. Door het gepaarde design heb je gegevens nodig over de mate van correlatie tussen de voor en de nameting. Je zou dat af kunnen leiden als de artikelen bovenop de genoemde mean en sd’s nog een van de volgende zaken vermelden:

- gemiddeld verschil tussen voor en na + sd of se

- of: toetsresultaat, bijv een paired t-test: t-statistic of p-waarde is voldoende

Zie ook Deel 16.1.3.2 van het Cochrane handboek voor verdere uitleg. De paired t-test kan inderdaad niet. Een mogelijke analyse zou een meta-analyse zijn op basis van changes + sd’s (die je dus eventueel kunt afleiden uit se’s of gepaarde test statistics).

Kan ik p-waardes in plaats van betrouwbaarheidsintervallen vermelden?

Ik ben bezig met een systematic review over het effect van een interventie op een dichotome uitkomst. Ik wil in mijn artikel graag een tabel met odds ratio's van univariate analyses weergeven, maar deze staan niet in alle artikelen van de geïncludeerde studies. De p-waardes staan er wel in. We hebben met de informatie in de artikelen wel de Odd's ratio berekend, maar we missen dan de betrouwbaarheidsintervallen. Is het aan te raden om de p-waarde in plaats van het betrouwbaarheidsinterval weer te geven?

Het is beter om een uniforme weergave in een artikel na te streven en dus voor alle studies de betrouwbaarheidsintervallen te vermelden. Als het lukt om de odds ratio’s te berekenen, heb je waarschijnlijk ook voldoende informatie om de betrouwbaarheidsintervallen zelf te berekenen, zie bijvoorbeeld [2].

Kan ik medianen poolen?

Voor een review wil ik graag waarden voor mediaan overlevingsduur uit de literatuur poolen. Welke mogelijkheden zijn er hiervoor? Hazard ratio’s worden meestal niet gerapporteerd en een individuele patiënt data meta-analyse is niet mogelijk. Is het omrekenen van de mediaan naar gemiddelde en vervolgens te poolen statistisch correct in deze situatie? Is er een mogelijkheid om de mediaan van de medianen te berekenen?

Onderzoekers hebben methoden ontwikkeld om de gemiddelde en standaard deviatie op basis van de mediaan, range en steekproefgrootte te berekenen [3]. Echter in het algemeen wordt de mediaan en interkwartiele range (in plaats van de gemiddelde en standaard deviatie) juist gerapporteerd omdat de uitkomst (hier overlevingsduur) geen normale verdeling volgt. De gemiddelde en standaard deviatie geven dus geen goede weergave van de verdeling. Andere onderzoekers zeggen wel een verbetering hierin te hebben bereikt [4]. De kwaliteit van de schattingen lijkt echter ook niet optimaal te zijn bij een niet-normale verdeling.

Er zijn wel methoden ontwikkeld om gepoolde schatters van medianen te krijgen, maar er wordt ook meteen aangegeven dat ze niet helemaal goed zijn [5]. De technische details zijn in een paper (ref 22 van [5]) dat niet makkelijk verkrijgbaar is. Andere onderzoekers stellen een andere methode voor, maar geven helaas weinig technische details [6]. Er is helaas geen eenvoudige manier om op een goede manier hierover een meta-analyse uit te voeren. De eenvoudige optie is om de uitkomsten van de verschillende studies te beschrijven.

Hoe kan ik een meta-analyse op kwaliteit van leven uitvoeren?

Ik ben bezig met een systematic review waarbij een van de uitkomsten kwaliteit van leven is. In vijf artikelen wordt kwaliteit van leven als uitkomstmaat beschreven. Het lastige is dat ze hiervoor verschillende algemene en ziektespecifieke vragenlijsten gebruiken. Kan ik deze op de een of andere manier aan elkaar gelijk stellen en hier toch een meta-analyse van maken?

In deze situatie kiest men er vaak voor om de uitkomsten van de verschillende studies om te zetten naar een maat voor effectgrootte, zoals bijvoorbeeld de standardized mean difference (gemiddelde verschil tussen twee groepen gedeeld door de standaard deviatie van dit verschil). Het kan echter moeilijk zijn om een klinische betekenis aan deze maat te geven. Onderzoekers hebben verschillende oplossingen hiervoor gevonden [7].

Hoe kan ik de resultaten van verschillende studies in mijn scriptie samenvatten?

Let op! er wordt nog aan dit onderdeel gewerkt.

Ik schrijf een scriptie en heb al een systematische review uitgevoerd. Ik wil nu de resultaten uit de verschillende studies samenvatten, maar ik heb onvoldoende statistische kennis om een meta-analyse uit te voeren. Wat kan ik doen en wat moet ik vooral niet doen?

Veel studenten moeten in de loop van hun studie een of meer systematische reviews schrijven. Vaak lopen ze ertegenaan dat ze de resultaten van de verschillende studies willen samenvatten, maar dat hun kennis van de statistiek nog niet voldoende is om een meta-analyse op de juiste manier uit te voeren. Er zijn mogelijkheden, maar ook valkuilen.

  • Je kunt de resultaten van de verschillende studies in de tekst van je scriptie samenvatten. Bij een kleine aantal studies kan dit al voldoende zijn. Bij een grotere aantal studies, kan je naast het beschrijven van alle studies bij elkaar, subgroepen van studies beschrijven. Mogelijk is het voor jouw vraagstelling interessant om de studies op "gezonde" en "zieke" mensen apart te beschrijven. Of geeft het meer inzicht als je de methodologisch gezien "goede" studies apart toelicht.
  • Het kan goed zijn om je resultaten steeds op basis van dezelfde eenheden en aantal cijfers achter de komma te rapporteren. Dit maakt het eenvoudiger voor de lezer om alle informatie te vergelijken. Het is goed mogelijk dat je de resultaten uit sommige studies in andere eenheden zal moeten omzetten. Denk bijvoorbeeld om het omzetten van serum glucose van mg/dL in mmol/L. Gebruik hiervoor een standaard waarde uit het vakgebied en vermeld ook in je methoden hoe je dit hebt gedaan.
  • Vaak vermelden niet alle studies alle informatie die je zoekt. Het is niet erg om aan te geven dat een bepaalde stuk informatie niet beschikbaar is. Maar het is goed om na te gaan of je deze informatie kan achterhalen. Soms wordt meer informatie in supplementary tables bij het betreffende publicatie gepresenteerd of wordt een groep patiënten in een andere publicatie uitgebreider beschreven. Maar het kan ook mogelijk zijn om een waarde, zoals een standaard deviatie of betrouwbaarheidsinterval, te herleiden uit andere waarden in een publicatie.
  • Bij een grotere aantal studies kan een tabel meer inzicht in de resultaten van de verschillende studies geven. Hieronder zie je een voorbeeld van een tabel waarbij de uitkomst van interesse is de serum glucose bij opname in het ziekenhuis. In dit voorbeeld zijn de studies gerangschikt op het aantal patiënten. Maar het kan ook inzichtelijk zijn om de studies op een andere kenmerk te rangschikken. Je kunt denken aan jaar van publicatie, de score op een instrument om de kwaliteit van de studie in kaart te brengen of een patiëntkenmerk, zoals de proportie patiënten met diabetes of de patiënten wel of niet nuchter bij opname waren.


Serum glucose (mmol/L) on hospital admission
First author and year of publication Total number of patients Number of patients with diabetes Proportion of patients with diabetes Fasting on admission Mean Standard deviation 95% Confidence interval for the mean
Koopman, 2013 1096 94 0.09 Yes 4.6 2.1
Buurman, 2011 532 0 0.00 Yes 5.5 3.0
Smit, 2011 789 562 0.71 Yes 7.5 5.9
Jansen, 2015 372 102 0.27 No 8.3 5.1
van de Berg, 2009 104 Unknown Unknown Unknown 6.7 3.7
Bakker, 1996 57 57 1.00 No 16.3 10.1
Meijer, 1973 45 Unknown Unknown Yes 4.8 1.7
Visser, 1981 30 10 0.33 Unknown 10.4 5.1


  • Een forest plot kan nog inzichtelijker zijn dan een tabel [8]. Als je geen meta-analyse uitvoert, kan je onderaan geen samenvattende maat geven, maar je kunt wel de betrouwbaarheidsintervallen voor alle studies onder elkaar zetten. Ook hier kan het informatief zijn om de studies op een bepaalde manier in groepen te presenteren.
  • Als je geïnteresseerd bent in een associatie tussen twee uitkomsten, bijvoorbeeld de proportie patiënten met diabetes en de gemiddelde bloed glucose bij ziekenhuisopname, overweeg een bubble chart te maken.

Hoe kan ik een individual patient data meta-analyse uitvoeren?

De aanwijzigen in dit artikel kunnen nuttig zijn [9].


Referenties

  1. Field AP, Gillett R. How to do a meta-analysis. Br J Math Stat Psychol. 2010 Nov;63(Pt 3):665-94. DOI 10.1348/000711010X502733 [field2010]
  2. Morris JA, Gardner MJ. Calculating confidence intervals for relative risks (odds ratios) and standardised ratios and rates. Br Med J (Clin Res Ed). 1988 May 7;296(6632):1313-6. [1] [morris1988]
  3. Hozo SP, Djulbegovic B, Hozo I. Estimating the mean and variance from the median, range, and the size of a sample. BMC Med Res Methodol. 2005 Apr 20;5:13. DOI 10.1186/1471-2288-5-13 [huzo2005]
  4. Wan X, Wang W, Liu J, Tong T. Estimating the sample mean and standard deviation from the sample size, median, range and/or interquartile range. BMC Med Res Methodol. 2014 Dec 19;14:135. DOI 10.1186/1471-2288-14-135 [wan2014]
  5. Michiels S, Piedbois P, Burdett S, Syz N, Stewart L, Pignon JP. Meta-analysis when only the median survival times are known: a comparison with individual patient data results. Int J Technol Assess Health Care. 2005 Winter;21(1):119-25. [1] [michiels2005]
  6. Zang J, Xiang C, He J. Synthesis of median survival time in meta-analysis. Epidemiology. 2013 Mar;24(2):337-8. DOI 10.1097/EDE.0b013e318282a66c [zang2013]
  7. Thorlund K, Walter SD, Johnston BC, Furukawa TA, Guyatt GH. Pooling health-related quality of life outcomes in meta-analysis—a tutorial and review of methods for enhancing interpretability. Research Synthesis Methods. 2011; 2(3): 188–203. DOI 10.1002/jrsm.46 [thorland2011]
  8. Lewis S, Clarke M. Forest plots: trying to see the wood and the trees. BMJ 2001;322:1479. DOI 10.1136/bmj.322.7300.1479 [lewis2001]
  9. Riley RD, Price MJ, Jackson D, Wardle M, Gueyffier F, Wang J, Staessen JA, White IR. Multivariate meta-analysis using individual participant data. Research Synthesis Methods. 2015; 6(2): 157–174. DOI 10.1002/jrsm.1129 [riley2015]
  10. Thompson SG, Higgins JPT. How should meta-regression analyses be undertaken and interpreted? Stat Med. 2002 Jun 15;21(11):1559-73. DOI 10.1002/sim.1187 [thompson2002]

Informatie op andere websites

Klaar met lezen? Je kunt naar het OVERZICHT van alle statistische onderwerpen op deze wiki gaan. Of naar de pagina KEUZE TOETS voor hulp bij het uitzoeken van een geschikte toets of analyse.

Wil je meer leren over biostatistiek? Volg dan de AMC e-learning Practical Biostatistics of bezoek de pagina met links naar andere websites en cursussen.

Vind je op deze pagina's iets dat niet klopt? Werkt een link niet? Of wil je bijdragen aan de wiki? Neem dan contact met ons op.