Difference between revisions of "Missing values"

From Wikistatistiek
Jump to navigation Jump to search
Line 4: Line 4:
  
 
Een GLM kan je wel uitvoeren wanneer je missende waarden hebt, maar hij neemt daarbij alleen de patienten mee die geen missende waarden hebben. Het is dus belangrijk om te weten in hoeveel % van je patienten de data compleet zijn. Als dit een aanzienlijk deel is kun je gewoon een GLM toepassen. Zo niet, dan kun je de data wellicht imputeren of uitwijken naar een ander model die beter om kan gaan met missende waardes (bijvoorbeeld een [[herhaalde metingen#linear mixed model| mixed model in geval van herhaalde metingen]]).  
 
Een GLM kan je wel uitvoeren wanneer je missende waarden hebt, maar hij neemt daarbij alleen de patienten mee die geen missende waarden hebben. Het is dus belangrijk om te weten in hoeveel % van je patienten de data compleet zijn. Als dit een aanzienlijk deel is kun je gewoon een GLM toepassen. Zo niet, dan kun je de data wellicht imputeren of uitwijken naar een ander model die beter om kan gaan met missende waardes (bijvoorbeeld een [[herhaalde metingen#linear mixed model| mixed model in geval van herhaalde metingen]]).  
 +
 +
==Van hoeveel % van mijn patienten moet de data compleet zijn om imputeren te rechtvaardigen?==
 +
Helaas is er niet direct een percentage te noemen dat imputeren nog valide maakt. Zie de referenties onder aan deze pagina voor informatie over de (on)mogelijkheden van imputeren
 +
 +
==welk programma kan ik het beste gebruiken om mijn missende data te imputeren?==
 +
In [[statistische software#SPSS|SPSS]] is er mogelijkheid voor het gebruiken van simple imputation methodes. De aanvulling 'SPSS Missing Values add-on' biedt ook multiple imputation aan (in het standaard pakket opgenomen in SPSS 17). Het verschil tussen simple en multiple imputation is kortweg: bij simple imputeer je de data 1 maal op 1 manier en gebruik je de verkregen dataset in je analyse. Bij multiple imputation imputeer je meerdere malen en kijk je hoe gevoelig de uitkomsten van je analyse zijn voor de verschillende gebruikte imputatietechnieken.
 +
 +
Verder hebben pakketten als [[statistische software#Stata|Stata]], [[statistische software#s-plus|S-Plus]], [[statistische software#SAS|SAS]] en [[statistische software#R|R]] (bijvoorbeeld aregImpute package Hmisc) allen routines voor multiple imputatie.
  
  

Revision as of 10:49, 12 August 2009

Kan een GLM missende waarden aan?

Ik wil een general linear model (GLM) gebruiken op een database. Ik heb begrepen dat als je missing values hebt, je deze analyse niet kan uitvoeren en je daarom de data moet imputeren. Klopt dit?

Een GLM kan je wel uitvoeren wanneer je missende waarden hebt, maar hij neemt daarbij alleen de patienten mee die geen missende waarden hebben. Het is dus belangrijk om te weten in hoeveel % van je patienten de data compleet zijn. Als dit een aanzienlijk deel is kun je gewoon een GLM toepassen. Zo niet, dan kun je de data wellicht imputeren of uitwijken naar een ander model die beter om kan gaan met missende waardes (bijvoorbeeld een mixed model in geval van herhaalde metingen).

Van hoeveel % van mijn patienten moet de data compleet zijn om imputeren te rechtvaardigen?

Helaas is er niet direct een percentage te noemen dat imputeren nog valide maakt. Zie de referenties onder aan deze pagina voor informatie over de (on)mogelijkheden van imputeren

welk programma kan ik het beste gebruiken om mijn missende data te imputeren?

In SPSS is er mogelijkheid voor het gebruiken van simple imputation methodes. De aanvulling 'SPSS Missing Values add-on' biedt ook multiple imputation aan (in het standaard pakket opgenomen in SPSS 17). Het verschil tussen simple en multiple imputation is kortweg: bij simple imputeer je de data 1 maal op 1 manier en gebruik je de verkregen dataset in je analyse. Bij multiple imputation imputeer je meerdere malen en kijk je hoe gevoelig de uitkomsten van je analyse zijn voor de verschillende gebruikte imputatietechnieken.

Verder hebben pakketten als Stata, S-Plus, SAS en R (bijvoorbeeld aregImpute package Hmisc) allen routines voor multiple imputatie.


Referenties

Terug naar OVERZICHT voor een overzicht van alle statistische onderwerpen op deze wiki.

Terug naar KEUZE TOETS voor hulp bij het uitzoeken van een geschikte toets of analyse.