Revision as of 11:34, 28 April 2009

Schema welke toets bij welke vergelijking

			type vergelijking
			1 groep	2 groepen		>2 groepen
			vs. referentie	gepaard	ongepaard	gepaard	ongepaard
type uit- komst- maat	(semi-) continu	normaal	1 sample t-toets	gepaarde t-toets	ongepaarde t-toets	linear mixed models	One-way ANOVA
	(semi-) continu	niet normaal	sign toets	Wilcoxon signed rank toets	Mann-Whitney U toets	Friedman toets	Kruskal Wallis
	discreet	binair (proportie)	z-test voor proporties	McNemars test	Chi-kwadraat toets / Fisher's exact toets	GLMM / GEE	Chi-kwadraat toets / Fisher's exact toets
	discreet	nominaal / ordinaal	x	McNemars toets / Wilcoxon signed rank toets	Chi-kwadraat toets (trend) / Fisher's exact toets	GLMM / GEE	Chi-kwadraat toets / Fisher's exact toets

Schema welke analyse bij welke associatie

			type associatie
			crosssectioneel		longitudinaal
			2 variabelen	meer variabelen	2 variabelen	meer variabelen
type uit- komst- maat	(semi-) continu	normaal	Pearson's rho	Lineaire regressie	Herhaalde metingen
	(semi-) continu	niet normaal	Spearman's rho / Kendall's tau	Niet lineaire regressie	Herhaalde metingen
	discreet	binair (proporties)	odds ratio/ risk ratio/ risk difference	Logistische regressie	Survival analyse	Cox regressie
	discreet	nominaal /ordinaal	x	multinomiale logistische regressie /ordinale logistische regressie	x	x

FAQ nav de twee schema's

Van welk type is mijn uitkomstmaat?

Continu versus discreet

Het belangrijkste onderscheid naar type is dat tussen continue en discrete variabelen. Een continue variabele kan in een bepaald interval iedere waarde aannemen. Een discrete variabele heeft slechts gehele getallen of klassen als mogelijke uitkomsten. Bijvoorbeeld: lengte en gewicht zijn continue variabelen, een telling van het aantal polibezoeken is een discrete variabele evenals de bepaling van de bloedgroepen A, B, AB en 0.

Nomiale variabelen

Op nominaal niveau gemeten variabelen zijn kwalitatieve variabelen, waarvan de categorieën niet in een vaste of zinvolle volgorde zijn te plaatsen. Voorbeeld. 'Bloedgroep' met als waarden A, B, AB en O of 'geslacht' met als waarden 'mannelijk' en 'vrouwelijk'.

Voor discrete variabelen wordt verder het onderscheid gemaakt tussen kwalitatieve en kwantitatieve discrete variabelen (continue variabelen zijn altijd kwantitatief). De waarden die kwalitatieve variabelen kunnen aannemen zijn geen getallen, maar kenmerken. We spreken ook wel van categorische variabelen of klasse-variabelen. Kwalitatieve variabelen zijn per definitie discrete variabelen, maar het omgekeerde is niet waar, aantallen zijn bijvoorbeeld geen kwalitatieve, maar kwantitatieve variabelen. Voorbeeld. 'Bloedgroep' met als klassewaarden A, B, O en AB, of 'sekse' met als kenmerken 'mannelijk' en 'vrouwelijk' zijn kwalitatieve variabelen. Deze kwalitatieve variabelen zijn tevens discreet. We kunnen aan deze uitkomsten wel getallen koppelen (bijvoorbeeld 'mannelijk' = 0, 'vrouwelijk' = 1), omdat dat handig is bij de data-analyse, maar ermee rekenen kan nog steeds niet.

Ordinale variabelen

Binaire variabelen

Heb ik gepaarde of ongepaarde data?

Data zijn gepaard als er twee (of meer) maal bij dezelfde personen een meting gedaan is. Als er sprake is van aparte, onafhankelijke groepen, dan zijn data ongepaard. Bijvoorbeeld:

Wij hebben bij een groep varkens een ziekte opgewekt. Daarna hebben bij de ene groep VROEG een interventie gedaan, en bij een andere groep LAAT een interventie gedaan. Welke statistische test moet ik gebruiken als ik: 1. Binnen een groep het verschil van VOOR en NA de interventie wil testen? 2. Het verschil tussen de 2 groepen (na de interventie) wil testen?

In het eerste geval zal er een gepaarde toets gedaan moeten worden, in het tweede geval een ongepaarde toets.

Hoe beoordeel ik de normaliteit van mijn data?

Wanneer concludeert de Shapiro Wilk test dat data niet normaal verdeeld is?

Ik dacht dat een Shapiro-Wilk test met p<0.05 betekende dat de data niet normaal verdeeld zijn. Nu heb ik van een collega een syntax ingekeken waar een grens van 0.9 wordt aangehouden. Wat is nou waar?

Formeel gezien, moet je bij een p<0.05 de nul hypothese verwerpen. In jouw geval, zou je dus op basis van de p-waarde moeten besluiten om de data als niet normaal te zien. Echter, wanneer je voldoende data hebt, kun je zelfs een irrelevant, maar statistisch significante afwijking van de normale verdeling vinden. De test statistic W van de Shapiro-Wilk test loopt van 0 tot 1, waarbij 1 betekent, dat de data perfect normaal verdeeld zijn. Vaak wordt meer naar deze waarde gekeken, dan naar de p-waarde, waarbij voor de W een ondergrens van 0.90 gehanteerd wordt. Als de test-stastistic W groter is dan 0.90 kan de data als normaal verdeeld beschouwd worden. (Er zijn veel voorbeelden waarbij de W > 0.99 is, terwijl de p < 0.05 is.)

Terug naar OVERZICHT voor een overzicht van alle statistische onderwerpen op deze wiki.

@@ Line 113: / Line 113: @@
 Het belangrijkste onderscheid naar type is dat tussen continue en discrete variabelen. Een continue variabele kan in een bepaald interval iedere waarde aannemen. Een discrete variabele heeft slechts gehele getallen of klassen als mogelijke uitkomsten. Bijvoorbeeld: lengte en gewicht zijn continue variabelen, een telling van het aantal polibezoeken is een discrete variabele evenals de bepaling van de bloedgroepen A, B, AB en 0.
-====Kwalitatieve versus kwantitatieve discreet====
+====Nomiale variabelen====
+Op nominaal niveau gemeten variabelen zijn kwalitatieve variabelen, waarvan de categorieën niet in een vaste of zinvolle volgorde zijn te plaatsen. Voorbeeld. 'Bloedgroep' met als waarden A, B, AB en O of 'geslacht' met als waarden 'mannelijk' en 'vrouwelijk'.
 Voor discrete variabelen wordt verder het onderscheid gemaakt tussen kwalitatieve en kwantitatieve discrete variabelen (continue variabelen zijn altijd kwantitatief). De waarden die kwalitatieve variabelen kunnen aannemen zijn geen getallen, maar kenmerken. We spreken ook wel van categorische variabelen of klasse-variabelen. Kwalitatieve variabelen zijn per definitie discrete variabelen, maar het omgekeerde is niet waar, aantallen zijn bijvoorbeeld geen kwalitatieve, maar kwantitatieve variabelen. Voorbeeld. 'Bloedgroep' met als klassewaarden A, B, O en AB, of 'sekse' met als kenmerken 'mannelijk' en 'vrouwelijk' zijn kwalitatieve variabelen. Deze kwalitatieve variabelen zijn tevens discreet. We kunnen aan deze uitkomsten wel getallen koppelen (bijvoorbeeld 'mannelijk' = 0, 'vrouwelijk' = 1), omdat dat handig is bij de data-analyse, maar ermee rekenen kan nog steeds niet.
-Daarnaast wordt onderscheid gemaakt in het meetniveau van variabelen. Voor discrete variabelen onderscheiden we
+====Ordinale variabelen====
-*Op nominaal niveau gemeten variabelen zijn kwalitatieve variabelen, waarvan de categorieën niet in een vaste of zinvolle volgorde zijn te plaatsen. Voorbeeld. 'Bloedgroep' met als waarden A, B, AB en O of 'geslacht' met als waarden 'mannelijk' en 'vrouwelijk'.
+====Binaire variabelen====
 == Heb ik gepaarde of ongepaarde data?==

KEUZE TOETS: Difference between revisions

Revision as of 11:34, 28 April 2009

Contents

Schema welke toets bij welke vergelijking

Schema welke analyse bij welke associatie

FAQ nav de twee schema's

Van welk type is mijn uitkomstmaat?

Continu versus discreet

Nomiale variabelen

Ordinale variabelen

Binaire variabelen

Heb ik gepaarde of ongepaarde data?

Hoe beoordeel ik de normaliteit van mijn data?

Wanneer concludeert de Shapiro Wilk test dat data niet normaal verdeeld is?

Navigation menu

KEUZE TOETS: Difference between revisions

Revision as of 11:34, 28 April 2009

Schema welke toets bij welke vergelijking

Schema welke analyse bij welke associatie

FAQ nav de twee schema's

Van welk type is mijn uitkomstmaat?

Continu versus discreet

Nomiale variabelen

Ordinale variabelen

Binaire variabelen

Heb ik gepaarde of ongepaarde data?

Hoe beoordeel ik de normaliteit van mijn data?

Wanneer concludeert de Shapiro Wilk test dat data niet normaal verdeeld is?

Navigation menu

Search