Correlatie: Difference between revisions

From Wikistatistiek
Jump to navigation Jump to search
mNo edit summary
 
(33 intermediate revisions by 2 users not shown)
Line 1: Line 1:
{{auteurs|
|mainauthor= prof. dr. R.J. de Haan
|coauthor= 
}}
==Pearson's ''r''==
==Pearson's ''r''==
Pearson’s correlatie coëfficiënt ''r'', soms ook wel de produkt-moment-correlatie-coëfficiënt (PMCC) genoemd, drukt de sterkte van een lineaire samenhang tussen twee variabelen uit in een getal. Het gebruik van Pearson’s ''r'' eist dat beide variabelen continue van aard zijn.
Pearson’s correlatie coëfficiënt ''r'', soms ook wel de produkt-moment-correlatie-coëfficiënt (PMCC) genoemd, drukt de sterkte van een lineaire samenhang tussen twee variabelen uit in een getal. Het gebruik van Pearson’s ''r'' eist dat beide variabelen continu van aard zijn.
 
 
'''1.1 Wanneer gebruik ik Pearson's ''r''?'''
 
Je gebruikt dit coëfficiënt als je geïnteresseerd bent in de lineaire samenhang (correlatie) tussen twee continue variabelen X en Y, bijvoorbeeld een onderzoek naar de samenhang tussen leeftijd en scores op een cognitieve test. De waarden van de coëfficiënt kunnen lopen van  -1 tot  +1. Is er sprake van een positieve correlatie dan neemt met een stijgende waarde van X ook de waarde van Y toe. Bij een negatieve (tegengestelde) correlatie neemt met een stijgende waarde van X, de waarde van Y af. Bij correlatie van +1 of -1 is er een perfect verband. In dat geval is de waarde van Y volledig te herleiden uit de waarde van X (en omgekeerd). Bij de waarde van 0 is er geen enkele lineaire samenhang.
samenhang.
 
De correlatie waarde is zogenaamd dimensieloos; dit betekent dat de correlatiewaarde ongevoelig is voor de eenheden waarin X en Y gemeten zijn. Meer statistisch geformuleerd: ''r''  is ongevoelig voor lineaire transformaties van de variabelen X en Y. Dus als je een correlatie zou hebben berekend tussen de patiënt zijn gewicht in kilogrammen en zijn vetpercentage, dan zou correlatie identiek zijn als dat je het gewicht van de patiënt zou hebben gemeten in ponden.
 
==Spearman's rho==
==intra class correlatie (icc)==
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 


=== Wanneer gebruik ik Pearson's ''r''? ===


Je gebruikt dit coëfficiënt als je geïnteresseerd bent in de lineaire samenhang (= correlatie) tussen twee continue variabelen X en Y, bijvoorbeeld een onderzoek naar de samenhang tussen leeftijd en scores op een cognitieve test. De waarden van de coëfficiënt kunnen lopen van  -1 tot  +1. Is er sprake van een positieve correlatie dan neemt met een stijgende waarde van X ook de waarde van Y toe. Bij een negatieve (tegengestelde) correlatie neemt met een stijgende waarde van X, de waarde van Y af. Bij correlatie van +1 of -1 is er een perfect verband. In dat geval is de waarde van Y volledig te herleiden uit de waarde van X (en omgekeerd). Bij de waarde van 0 is er geen enkele lineaire samenhang.


De correlatie waarde is zogenaamd dimensieloos; dit betekent dat de correlatiewaarde ongevoelig is voor de eenheden waarin X en Y gemeten zijn. Wat meer statistisch geformuleerd: r  is ongevoelig voor lineaire transformaties van de variabelen X en Y. Dus als je een correlatie zou hebben berekend tussen de patiënt zijn gewicht in kilogrammen en zijn vetpercentage,  dan zal die correlatie identiek zijn als dat je het gewicht van de patiënt zou hebben gemeten in ponden.


=== Hoe interpreteer ik Pearson’s ''r''? ===


Pearson’s ’ r is een eenvoudige statistische maat. Toch is de interpretatie daarvan niet altijd even makkelijk. Bij de interpretatie moet je rekening houden met een aantal zaken. Als de correlatie 0 is, dan is er geen lineair verband. Dat wil niet zegen dat er geen andersoortig verband kan zijn. Het is daarom belangrijk om altijd eerst een scatterplot (spreidingsdiagram) te maken. Ook moet je rekening houden met het feit dat Pearson’s r erg gevoelig is voor extreme waarden (uitbijters/[[outliers]]) in je dataset. Verwar ook niet  het begrip samenhang met causaliteit. X is de oorzaak van Y als een verandering in Y het gevolg is van een verandering in X. Als er een correlatie is tussen X en Y is, dan hoeft die samenhang niet causaal van aard te zijn. Er kan immers sprake zijn van wederzijdse beïnvloeding, of de correlatie tussen X en Y kan (deels) verklaard worden door allerlei andere factoren. 


===Waar vind ik Pearson’s r in SPSS? ===


Je vindt deze correlatietechniek  in SPSS onder Analyze -> Correlate -> Bivariate .


==Spearman's rho==


===Wanneer gebruik ik Spearman’s rang-correlatie?===


De variabelen X en Y zijn niet altijd continu van aard. Als beide of één van beide variabelen geen continu (maar een [[KEUZE TOETS#Van welk type is mijn data?|discreet ordinaal]]) karakter hebben, kan geen Pearson’s correlatie worden berekend. In dat geval kan je de associatie tussen X en Y het beste uitdrukken in een Spearman’s rang correlatie. De Spearman’s rang correlatie coëfficiënt is nagenoeg gelijk aan de Pearson’s correlatie coëfficiënt, berekend op de rangnummers van de data. De Spearman correlatie is ook een goed alternatief voor de Pearson correlatie als in je dataset uitbijters voorkomen. Door de data te vervangen door rangnummers krijgen uitbijters immers veel minder gewicht dan bij het berekenen van de Pearson.


===Waar vind ik Spearman’s rang-correlatie in SPSS?===
Je vindt deze correlatietechniek  in SPSS onder Analyze -> Correlate -> Bivariate -> klik Spearman aan.




==biseriele correlatie==
{{Onderschrift}}

Latest revision as of 12:47, 24 June 2024

Auteur prof. dr. R.J. de Haan
Co-Auteur
auteurschap op deze site

Pearson's r

Pearson’s correlatie coëfficiënt r, soms ook wel de produkt-moment-correlatie-coëfficiënt (PMCC) genoemd, drukt de sterkte van een lineaire samenhang tussen twee variabelen uit in een getal. Het gebruik van Pearson’s r eist dat beide variabelen continu van aard zijn.

Wanneer gebruik ik Pearson's r?

Je gebruikt dit coëfficiënt als je geïnteresseerd bent in de lineaire samenhang (= correlatie) tussen twee continue variabelen X en Y, bijvoorbeeld een onderzoek naar de samenhang tussen leeftijd en scores op een cognitieve test. De waarden van de coëfficiënt kunnen lopen van -1 tot +1. Is er sprake van een positieve correlatie dan neemt met een stijgende waarde van X ook de waarde van Y toe. Bij een negatieve (tegengestelde) correlatie neemt met een stijgende waarde van X, de waarde van Y af. Bij correlatie van +1 of -1 is er een perfect verband. In dat geval is de waarde van Y volledig te herleiden uit de waarde van X (en omgekeerd). Bij de waarde van 0 is er geen enkele lineaire samenhang.

De correlatie waarde is zogenaamd dimensieloos; dit betekent dat de correlatiewaarde ongevoelig is voor de eenheden waarin X en Y gemeten zijn. Wat meer statistisch geformuleerd: r is ongevoelig voor lineaire transformaties van de variabelen X en Y. Dus als je een correlatie zou hebben berekend tussen de patiënt zijn gewicht in kilogrammen en zijn vetpercentage, dan zal die correlatie identiek zijn als dat je het gewicht van de patiënt zou hebben gemeten in ponden.

Hoe interpreteer ik Pearson’s r?

Pearson’s ’ r is een eenvoudige statistische maat. Toch is de interpretatie daarvan niet altijd even makkelijk. Bij de interpretatie moet je rekening houden met een aantal zaken. Als de correlatie 0 is, dan is er geen lineair verband. Dat wil niet zegen dat er geen andersoortig verband kan zijn. Het is daarom belangrijk om altijd eerst een scatterplot (spreidingsdiagram) te maken. Ook moet je rekening houden met het feit dat Pearson’s r erg gevoelig is voor extreme waarden (uitbijters/outliers) in je dataset. Verwar ook niet het begrip samenhang met causaliteit. X is de oorzaak van Y als een verandering in Y het gevolg is van een verandering in X. Als er een correlatie is tussen X en Y is, dan hoeft die samenhang niet causaal van aard te zijn. Er kan immers sprake zijn van wederzijdse beïnvloeding, of de correlatie tussen X en Y kan (deels) verklaard worden door allerlei andere factoren.

Waar vind ik Pearson’s r in SPSS?

Je vindt deze correlatietechniek in SPSS onder Analyze -> Correlate -> Bivariate .

Spearman's rho

Wanneer gebruik ik Spearman’s rang-correlatie?

De variabelen X en Y zijn niet altijd continu van aard. Als beide of één van beide variabelen geen continu (maar een discreet ordinaal) karakter hebben, kan geen Pearson’s correlatie worden berekend. In dat geval kan je de associatie tussen X en Y het beste uitdrukken in een Spearman’s rang correlatie. De Spearman’s rang correlatie coëfficiënt is nagenoeg gelijk aan de Pearson’s correlatie coëfficiënt, berekend op de rangnummers van de data. De Spearman correlatie is ook een goed alternatief voor de Pearson correlatie als in je dataset uitbijters voorkomen. Door de data te vervangen door rangnummers krijgen uitbijters immers veel minder gewicht dan bij het berekenen van de Pearson.

Waar vind ik Spearman’s rang-correlatie in SPSS?

Je vindt deze correlatietechniek in SPSS onder Analyze -> Correlate -> Bivariate -> klik Spearman aan.


Klaar met lezen? Je kunt naar het OVERZICHT van alle statistische onderwerpen op deze wiki gaan of naar de pagina KEUZE TOETS voor hulp bij het uitzoeken van een geschikte toets of analyse. Wil je meer leren over biostatistiek? Volg dan de AMC e-learning Practical Biostatistics. Vind je op deze pagina's iets dat niet klopt? Werkt een link niet? Of wil je bijdragen aan de wiki? Neem dan contact met ons op.

De wiki biostatistiek is een initiatief van de voormalige helpdesk statistiek van Amsterdam UMC, locatie AMC. Medewerkers van Amsterdam UMC kunnen via intranet ondersteuning aanvragen.