Herhaalde metingen: Difference between revisions

From Wikistatistiek
Jump to navigation Jump to search
 
(74 intermediate revisions by 4 users not shown)
Line 1: Line 1:
{{auteurs|
|mainauthor= [[user:Nan van Geloven|dr. ir. N van Geloven]]
|coauthor=  prof. dr. A.H. Zwinderman
}}
==Wat zijn herhaalde metingen?==
==Wat zijn herhaalde metingen?==


Herhaalde metingen zijn meerdere metingen van dezelfde variabele bij dezelfde persoon/patient, proefdier, of algemeen geformuleerd, dezelfde observationele eenheid. Voorbeelden:
Herhaalde metingen zijn meerdere metingen van dezelfde variabele bij dezelfde persoon, patient, proefdier, of algemeen geformuleerd, dezelfde observationele eenheid. Voorbeelden:


*'''herhaling in de tijd''': als patienten herhaaldelijk in een follow-up periode worden gemeten (of: voor en na een behandeling);
*'''herhaling in de tijd''': als patienten herhaaldelijk in een follow-up periode worden gemeten (of: voor en na een behandeling);
*'''meerdere locaties''': metingen op meerdere locaties in het lichaam van dezelfde persoon (linker en rechter oog, meerdere coupes in een biopt, meerdere slices in een MRI beeld);
*'''meerdere locaties''': metingen op meerdere locaties in het lichaam van dezelfde persoon (linker en rechter oog, meerdere coupes in een biopt, meerdere slices in een MRI beeld);
*'''meerdere condities''': als dezelfde patient onder twee of meer verschillende condities (bijv. behandelingen) wordt gemeten;
*'''meerdere condities''': als dezelfde patient onder twee of meer verschillende condities (bijv. behandelingen) wordt gemeten, bijvoorbeeld bij een cross-over studie;
*'''herhalingen tbv nauwkeurigheid''': als een meting een grote variatie binnen een persoon heeft (of een grote meetfout) dan kan het zinvol zijn om een aantal aparte metingen te doen.
*'''herhalingen tbv nauwkeurigheid''': als een meting een grote variatie binnen een persoon heeft (of een grote meetfout) dan kan het zinvol zijn om een aantal aparte metingen te doen;
*'''multilevel structuren''': als metingen bij meerdere personen gedaan zijn die onderdeel uitmaken van dezelfde groep. Bijvoorbeeld patienten die dezelfde huisarts hebben, waarbij de interventie per huisartspraktijk is uitgevoerd. Het klassieke voorbeeld hier zijn leerlingen die dezelfde docent hebben en docenten die weer bij eenzelfde school horen.


==Waarom kun je bij herhaalde metingen geen standaard regressie model gebruiken?==
==Waarom kun je bij herhaalde metingen geen standaard regressiemodel gebruiken?==


Bij een standaard regressie model wordt aangenomen dat alle metingen onafhankelijk van elkaar zijn. Bij herhaalde metingen is het waarschijnlijk dat twee metingen van dezelfde persoon meer op elkaar lijken dan twee metingen van verschillende personen. Als dat zo is, dan zijn de metingen binnen dezelfde persoon niet onafhankelijk. Als bij herhaalde metingen geen rekening wordt gehouden met deze afhankelijkheid, dan zijn i.h.a. de standaard fouten en de p-waardes (onterecht!) te klein.  
Bij een standaard regressiemodel wordt aangenomen dat alle metingen onafhankelijk van elkaar zijn. Bij herhaalde metingen is het waarschijnlijk dat twee metingen van dezelfde persoon meer op elkaar lijken dan twee metingen van verschillende personen. Als dat zo is, dan zijn de metingen binnen dezelfde persoon niet onafhankelijk. Als bij herhaalde metingen geen rekening wordt gehouden met deze afhankelijkheid, dan zijn i.h.a. de standaard fouten en de p-waardes (onterecht!) te klein.  
Bovendien kan de uitkomst van de regressie analyse volkomen fout zijn, zoals geillustreerd in het plaatje dat hieronder staat. In dit figuurtje worden de observaties van 6 personen getoond en elke persoon laat een duidelijk stijgende trend zien. Als de afhankelijkheid van de waarnemingen genegeerd wordt, dan is de best passende regressie lijn door de totale punten-wolk de gele dalende lijn en deze geeft geen correcte weergave van de trend per patient.
Bovendien kan de uitkomst van de regressie-analyse volkomen fout zijn, zoals geïllustreerd in het plaatje dat hieronder staat. In deze figuur worden de observaties van 12 personen getoond en elke persoon laat een duidelijk stijgende trend zien. Als de afhankelijkheid van de waarnemingen genegeerd wordt, dan is de best passende regressielijn door de totale puntenwolk de oranje dalende lijn en deze geeft geen correcte weergave van de trend per patiënt.


 
[[Image:14189829-0.jpg|500px]]
[[Image:Afbeelding herhaalde metingen.jpg]]


==Welke analyses zijn er mogelijk voor herhaalde metingen?==
==Welke analyses zijn er mogelijk voor herhaalde metingen?==


*'''Simpele methodes''': meting van slechts een tijdpunt gebruiken, de verandering tussen twee meetpunten gebruiken, een samenvattende maat zoals het gemiddelde of de [[herhaalde metingen#area under the curve| area under the curve]]
*'''Simpele methodes''': Soms kunnen herhaalde metingen samengevat worden in een enkele relevante maat. Je kunt bijvoorbeeld de meting van slechts een tijdpunt gebruiken, de verandering tussen twee meetpunten gebruiken, een samenvattende maat zoals het gemiddelde of de [[herhaalde metingen#area under the curve| area under the curve]] uitrekenen, of de tijd tot het bereiken van een bepaald level analyseren in een [[survival analyse]].
*'''Geavanceerde methodes''': [[herhaalde metingen#mixed models|mixed models]], [[herhaalde metingen#repeated measurements ANOVA|repeated measurements ANOVA]], Generalized Estimation Equations (GEE)
*'''Geavanceerde methodes''': Methodes die wel herhaalde metingen aankunnen zijn o.a. [[mixed effects modellen]], [[repeated measures ANOVA]] en [[generalized estimating equations]] (GEE).


De simpele methodes gebruiken maar een deel van de verzamelde informatie en dat levert vaak minder onderscheidingsvermogen (power) op.
De simpele methodes gebruiken maar een deel van de verzamelde informatie en dat levert vaak minder onderscheidingsvermogen (power) op.
Repeated measurements ANOVA is een specifieke variant van mixed-models, maar is alleen beschikbaar voor [[KEUZE TOETS#Van welk type is mijn data?|continue normaal verdeelde]] afhankelijke variabelen, die op vaste en dezelfde tijdstippen zijn gemeten in alle patienten.  
Repeated measurements ANOVA is een specifieke variant van mixed-models, maar is alleen beschikbaar voor [[KEUZE TOETS#Van welk type is mijn data?|continue normaal verdeelde]] afhankelijke variabelen, die op vaste en dezelfde tijdstippen zijn gemeten in alle patienten.  
Mixed-models en GEE-modellen zijn wat lastiger te specificeren, maar zijn flexibeler en zijn beschikbaar voor zowel continue normaal verdeelde afhankelijke variabelen, als voor bijv [[KEUZE TOETS#Van welk type is mijn data?|dichotome]] afhankelijke variabelen.
Mixed-models en GEE-modellen zijn wat lastiger te specificeren, maar zijn flexibeler en zijn beschikbaar voor zowel continue normaal verdeelde afhankelijke variabelen, als voor bijv [[KEUZE TOETS#Van welk type is mijn data?|dichotome]] afhankelijke variabelen. Bovendien kunnen de mixed modellen ook omgaan met een zekere mate van [[missing values]], namelijk wanneer de data [[missing values#Welke soorten missing values zijn er?|missing at random]] zijn.


=area under the curve=


==Wat is een area under the curve en wanneer kun je die gebruiken?==
=Repeated measures ANOVA=
Wanneer er op meerdere tijdstippen metingen zijn van een patient, kun je die samenvatten in een "area under the curve". Hierbij bereken je per patient de oppervlakte onder de gemeten punten in de tijd. Deze samenvattende maat gebruik je vervolgens voor de analyse.


==Hoe bereken ik met SPSS een area under the curve bij herhaalde metingen?==
[[repeated measures ANOVA | Repeated measurements analysis of variance (ANOVA)]]  is een statistische methode om herhaalde metingen van een continue, normaal verdeelde afhankelijke variabele te analyseren. Deze methode is te gebruiken als de afhankelijke variabel op een beperkte aantal vaste tijdstippen is gemeten en waarbij alle patiënten op alle tijdstippen gemeten zijn.
''Ik wil graag van een bepaalde meting in de tijd, op verschillende tijdstippen gemeten, de 'area under the curve' bepalen. Ik kom er met SPSS niet uit. Ik moet er nl een stuk of 300 bepalen... heeft u nog een advies?


Je kunt de volgende [[Media: Syntax_for_calculating_AUC.doc | syntax ]] gebruiken, deze rekent per patient een area under the curve uit. Bovenaan het document staat beschreven hoe je de variabelen in SPSS moet hebben staan.


=mixed models=


==Waarin verschilt een mixed model van een gewoon regressiemodel?==
=Area under the curve=


Wanneer er op meerdere tijdstippen metingen zijn van een patient, kun je die samenvatten in een "area under the curve". Hierbij bereken je per patient de oppervlakte onder de gemeten punten in de tijd. Deze samenvattende maat gebruik je vervolgens voor de analyse.


==Hoe bereken ik met SPSS een area under the curve bij herhaalde metingen?==
''Ik wil graag van een bepaalde meting in de tijd, op verschillende tijdstippen gemeten, de 'area under the curve' bepalen. Ik kom er met SPSS niet uit. Ik moet er nl een stuk of 300 bepalen... heeft u nog een advies?


Je kunt de volgende [[Media: Syntax_for_calculating_AUC.doc | syntax ]] gebruiken, deze rekent per patient een area under the curve uit. Bovenaan het document staat beschreven hoe je de variabelen in SPSS moet hebben staan.


Correlaties/covarianties tussen meetpunten worden meegemodelleerd.
= Hoe kan ik data van 4 experimenten combineren? =


Hier eventueel formule
''De experimenten die ik verricht, heb ik in 4 sessies opgesplitst, aangezien het niet behapbaar was alle samples in een keer te verwerken. Nu blijkt dat de vergelijkingsgroepen (verschillende diagnoses) binnen elke serie toch wel erg klein zijn en vraag ik me af of en hoe ik de data van de 4 series zou kunnen combineren.


==Hoe modelleer ik de covariantiestructuur van mijn mixed model?==
Wat wel gebruikt wordt bij zulk soort settings is het toepassen van een factor correctie. Zie ook de referentie naar de paper van Ruijter <cite>[Ruijter2006]</cite> onderaan op deze pagina. Je kunt ook binnen een statistisch model een correctie voor de 'clustering'  binnen sessies meenemen, bijvoorbeeld door een [[herhaalde metingen#mixed models|mixed]] of [[herhaalde metingen#repeated measurements ANOVA|glm-repeated]] analyse te doen. Je beschouwt de experimenten dan als 'herhaalde metingen' binnen een sessie.


Twee opties:
1. direct de covariantie structuur specificeren
2. random effects specificeren


== Waar vind ik linear mixed models in SPSS?==
Je vindt de linear mixed models in SPSS 16 onder Analyze->Mixed models->Linear. In SPSS 16 is er alleen nog een mixed model beschikbaar voor lineaire uitkomsten. In andere pakketten zoals [[statistische software#R|R]] en [[statistische software#SAS|SAS]] zijn er ook mixed modellen beschikbaar voor bijvoorbeeld dichotome uitkomstmaten.


==Voorbeeld: hoe analyseer ik met een mixed model een effect in de tijd?==
= Referenties =
''Ik onderzoek een groep patienten die een operatie hebben ondergaan. We zijn geinteresseerd in de pijnscore (VAS) op verschillende tijdsmomenten na de operatie. De verwachting is (uiteraard) dat de pijn direct na de operatie heviger is dan bijv. 3 mnd daarna (dit klopt ook als je de data in een barplot zet). In eerste instantie heb ik de ANOVA for repeated measures gebruikt om te analyseren of de pijn significant verandert in de tijd. Maar, omdat ik een aantal missing data heb, heb ik ook geprobeerd een mixed models analyse (hier mijn [[Media:voorbeeld_mixed_model_spss.doc|syntax]]) te doen. Mijn vragen hierover: 
<biblio>
#Gueorguieva2004 Gueorguieva R, Krystal JH. Move Over ANOVA: Progress in Analyzing Repeated-Measures Data and Its Reflection in Papers Published in the Archives of General Psychiatry. Arch Gen Psychiatry. 2004 Mar;61(3):310-7. [http://archpsyc.ama-assn.org/cgi/reprint/61/3/310]


''1. Heb ik de juiste covariance structure gebruikt? (nl. AR1)
#Ruijter2006 Ruijter JM, Thygesen HH, Schoneveld OJ, Das AT, Berkhout B, Lamers WH, Factor correction as a tool to eliminate between-session variation in replicate experiments: application to molecular biology and retrovirology, Retrovirology. 2006 Jan 6;3:2. [http://www.pubmedcentral.nih.gov/articlerender.fcgi?tool=pubmed&pubmedid=16398936]


''2. Ik heb 'tijd' als fixed effect genomen omdat de afname van de VAS op specifieke tijdsmomenten gebeurde, klopt dat?
#West BT, Analyzing Longitudinal Data With the Linear Mixed Models Procedure in SPSS. Eval Health Prof 2009 32: 207-228. [http://ehp.sagepub.com/content/32/3/207.full.pdf]
 
</biblio>
''3. Hoe geef de resultaten van deze mixed analyse weer?
 
1. Of AR(1) de beste is is niet zo te zeggen, dat hangt af van de correlatie tussen de tijdsmomenten in jouw data. Je kunt bijvoorbeeld alle mogelijke structuren draaien en dan degene met de kleinste AIC te kiezen (smaller is better zoals er ook onder staat).  
 
2. Tijd is hier inderdaad een fixed variable, want je wilt hier de hypothese toetsen of er een verandering in de tijd is.
 
3. In de output vind je onder "fixed effects" een B (beta) die aangeeft wat het effect is per tijdspunt (tov het startpunt) en een bijbehorende p-waarde. Dit is de toets die je waarschijnlijk wilt rapporteren. Onder het kopje "mean estimates" vind je de schatting van het model voor de gemiddelde VAS waarde op ieder tijdpunt. Deze mean estimates zijn voor een lezer makkelijker te interpreteren dan de betas.
 
=repeated measurements ANOVA=
 
==Wanneer kan ik een repeated measurements ANOVA gebruiken?==
 
*geen / niet te veel missings
*vaste covariantie structuur
 
== Waar vind ik de repeated measurements ANOVA in SPSS?==
 
Je vindt de repeated measurements ANOVA in SPSS 16 onder Analyze->General Linear Model->Repeated measures.
 
= Referenties =


=Informatie op andere websites=
*Deze post van Jonathan Bartlett over [http://thestatsgeek.com/2017/05/11/odds-ratios-collapsibility-marginal-vs-conditional-gee-vs-glmms/ Odds ratios, collapsibility, marginal vs. conditional, GEE vs GLMMs ] geeft aan wat het verschil is tussen GEE en GLMM (mixed model) aanpak bij binaire uitkomsten.
*[http://www.cscu.cornell.edu/news/statnews/stnews76.pdf GEE newsletter] van Cornell Statistical Consulting Unit, Cornell University.
* [http://www.theanalysisfactor.com/repeated-and-random-2/ The analysis factor - The Repeated and Random Statements in Mixed Models for Repeated Measures] info over het onderscheid tussen de repeated en de random statement in SPSS mixed.
* [http://www.theanalysisfactor.com/repeated-measures-approaches/ The analysis factor] info over de verschillende aanpakken voor herhaalde metingen: repeated measurements anova, marginal model, mixed model.
* [http://www.floppybunny.org/robin/web/virtualclassroom/stats/course2.html Robin Beaumont Heath Informatics course material] Vrij te gebruiken cursusmateriaal over linear mixed models met uileg van specificatie in zowel SPSS als R, zie week 6 7 en 8. Inclusief bijbehorende Youtube instructiefilmpjes.


<div style="background-color:#e8f1ff; margin:0.5em; padding:1em; border:1px solid #C8D0DC;">
=Sofwaretips=
Terug naar [[OVERZICHT]] voor een overzicht van alle statistische onderwerpen op deze wiki.
*[http://www.gllamm.org/ GLLAMM] Een familie functies (vrij te downloaden/attachen) in [[Statistische software#Stata|Stata]], waarbij er opties zijn voor het modelleren van herhaaldelijk gemeten niet continue uitkomstmaten (dichotome, ordinale etc).
*[http://tigger.uic.edu/~hedeker/mix.html SuperMix] Een standalone programma geschikt voor het modelleren van herhaaldelijk gemeten niet continue uitkomstmaten (dichotome, ordinale etc).


Terug naar [[KEUZE TOETS]] voor hulp bij het uitzoeken van een geschikte toets of analyse.
{{onderschrift}}
<div>

Latest revision as of 16:24, 21 April 2022

Auteur dr. ir. N van Geloven
Co-Auteur prof. dr. A.H. Zwinderman
auteurschap op deze site

Wat zijn herhaalde metingen?

Herhaalde metingen zijn meerdere metingen van dezelfde variabele bij dezelfde persoon, patient, proefdier, of algemeen geformuleerd, dezelfde observationele eenheid. Voorbeelden:

  • herhaling in de tijd: als patienten herhaaldelijk in een follow-up periode worden gemeten (of: voor en na een behandeling);
  • meerdere locaties: metingen op meerdere locaties in het lichaam van dezelfde persoon (linker en rechter oog, meerdere coupes in een biopt, meerdere slices in een MRI beeld);
  • meerdere condities: als dezelfde patient onder twee of meer verschillende condities (bijv. behandelingen) wordt gemeten, bijvoorbeeld bij een cross-over studie;
  • herhalingen tbv nauwkeurigheid: als een meting een grote variatie binnen een persoon heeft (of een grote meetfout) dan kan het zinvol zijn om een aantal aparte metingen te doen;
  • multilevel structuren: als metingen bij meerdere personen gedaan zijn die onderdeel uitmaken van dezelfde groep. Bijvoorbeeld patienten die dezelfde huisarts hebben, waarbij de interventie per huisartspraktijk is uitgevoerd. Het klassieke voorbeeld hier zijn leerlingen die dezelfde docent hebben en docenten die weer bij eenzelfde school horen.

Waarom kun je bij herhaalde metingen geen standaard regressiemodel gebruiken?

Bij een standaard regressiemodel wordt aangenomen dat alle metingen onafhankelijk van elkaar zijn. Bij herhaalde metingen is het waarschijnlijk dat twee metingen van dezelfde persoon meer op elkaar lijken dan twee metingen van verschillende personen. Als dat zo is, dan zijn de metingen binnen dezelfde persoon niet onafhankelijk. Als bij herhaalde metingen geen rekening wordt gehouden met deze afhankelijkheid, dan zijn i.h.a. de standaard fouten en de p-waardes (onterecht!) te klein. Bovendien kan de uitkomst van de regressie-analyse volkomen fout zijn, zoals geïllustreerd in het plaatje dat hieronder staat. In deze figuur worden de observaties van 12 personen getoond en elke persoon laat een duidelijk stijgende trend zien. Als de afhankelijkheid van de waarnemingen genegeerd wordt, dan is de best passende regressielijn door de totale puntenwolk de oranje dalende lijn en deze geeft geen correcte weergave van de trend per patiënt.

14189829-0.jpg

Welke analyses zijn er mogelijk voor herhaalde metingen?

De simpele methodes gebruiken maar een deel van de verzamelde informatie en dat levert vaak minder onderscheidingsvermogen (power) op. Repeated measurements ANOVA is een specifieke variant van mixed-models, maar is alleen beschikbaar voor continue normaal verdeelde afhankelijke variabelen, die op vaste en dezelfde tijdstippen zijn gemeten in alle patienten. Mixed-models en GEE-modellen zijn wat lastiger te specificeren, maar zijn flexibeler en zijn beschikbaar voor zowel continue normaal verdeelde afhankelijke variabelen, als voor bijv dichotome afhankelijke variabelen. Bovendien kunnen de mixed modellen ook omgaan met een zekere mate van missing values, namelijk wanneer de data missing at random zijn.


Repeated measures ANOVA

Repeated measurements analysis of variance (ANOVA) is een statistische methode om herhaalde metingen van een continue, normaal verdeelde afhankelijke variabele te analyseren. Deze methode is te gebruiken als de afhankelijke variabel op een beperkte aantal vaste tijdstippen is gemeten en waarbij alle patiënten op alle tijdstippen gemeten zijn.


Area under the curve

Wanneer er op meerdere tijdstippen metingen zijn van een patient, kun je die samenvatten in een "area under the curve". Hierbij bereken je per patient de oppervlakte onder de gemeten punten in de tijd. Deze samenvattende maat gebruik je vervolgens voor de analyse.

Hoe bereken ik met SPSS een area under the curve bij herhaalde metingen?

Ik wil graag van een bepaalde meting in de tijd, op verschillende tijdstippen gemeten, de 'area under the curve' bepalen. Ik kom er met SPSS niet uit. Ik moet er nl een stuk of 300 bepalen... heeft u nog een advies?

Je kunt de volgende syntax gebruiken, deze rekent per patient een area under the curve uit. Bovenaan het document staat beschreven hoe je de variabelen in SPSS moet hebben staan.

Hoe kan ik data van 4 experimenten combineren?

De experimenten die ik verricht, heb ik in 4 sessies opgesplitst, aangezien het niet behapbaar was alle samples in een keer te verwerken. Nu blijkt dat de vergelijkingsgroepen (verschillende diagnoses) binnen elke serie toch wel erg klein zijn en vraag ik me af of en hoe ik de data van de 4 series zou kunnen combineren.

Wat wel gebruikt wordt bij zulk soort settings is het toepassen van een factor correctie. Zie ook de referentie naar de paper van Ruijter [1] onderaan op deze pagina. Je kunt ook binnen een statistisch model een correctie voor de 'clustering' binnen sessies meenemen, bijvoorbeeld door een mixed of glm-repeated analyse te doen. Je beschouwt de experimenten dan als 'herhaalde metingen' binnen een sessie.


Referenties

  1. Ruijter JM, Thygesen HH, Schoneveld OJ, Das AT, Berkhout B, Lamers WH, Factor correction as a tool to eliminate between-session variation in replicate experiments: application to molecular biology and retrovirology, Retrovirology. 2006 Jan 6;3:2. [1]

    [Ruijter2006]
  2. Gueorguieva R, Krystal JH. Move Over ANOVA: Progress in Analyzing Repeated-Measures Data and Its Reflection in Papers Published in the Archives of General Psychiatry. Arch Gen Psychiatry. 2004 Mar;61(3):310-7. [1]

    [Gueorguieva2004]
  3. BT, Analyzing Longitudinal Data With the Linear Mixed Models Procedure in SPSS. Eval Health Prof 2009 32: 207-228. [1]

    [West]

Informatie op andere websites

Sofwaretips

  • GLLAMM Een familie functies (vrij te downloaden/attachen) in Stata, waarbij er opties zijn voor het modelleren van herhaaldelijk gemeten niet continue uitkomstmaten (dichotome, ordinale etc).
  • SuperMix Een standalone programma geschikt voor het modelleren van herhaaldelijk gemeten niet continue uitkomstmaten (dichotome, ordinale etc).

Klaar met lezen? Je kunt naar het OVERZICHT van alle statistische onderwerpen op deze wiki gaan of naar de pagina KEUZE TOETS voor hulp bij het uitzoeken van een geschikte toets of analyse. Wil je meer leren over biostatistiek? Volg dan de AMC e-learning Practical Biostatistics. Vind je op deze pagina's iets dat niet klopt? Werkt een link niet? Of wil je bijdragen aan de wiki? Neem dan contact met ons op.

De wiki biostatistiek is een initiatief van de helpdesk statistiek van Amsterdam UMC, locatie AMC. Medewerkers van Amsterdam UMC, locatie AMC kunnen via intranet ondersteuning aanvragen. Ondersteuning aan studenten of derden is niet mogelijk.