Association vs Correlation
Associasjon og korrelasjon er to metoder for å forklare en sammenheng mellom to statistiske variabler. Assosiasjon refererer til et mer generalisert begrep og korrelasjon kan betraktes som et spesielt tilfelle av assosiasjon, der forholdet mellom variablene er lineært.
Hva er Association?
Det statistiske begrepet assosiasjon er definert som en sammenheng mellom to tilfeldige variabler som gjør dem statistisk avhengige. Det refererer til snarere et generelt forhold uten at det nevnes konkrete forhold, og det er ikke nødvendig å være en årsakssammenheng.
Mange statistiske metoder brukes for å etablere sammenhengen mellom to variabler. Pearsons korrelasjonskoeffisient, oddsforhold, avstandskorrelasjon, Goodmans og Kruskals Lambda og Spearmans rho (ρ) er noen eksempler.
Hva er korrelasjon?
Korrelasjon er et mål på styrken til sammenhengen mellom to variabler. Korrelasjonskoeffisienten kvantifiserer graden av endring av en variabel basert på endringen av den andre variabelen. I statistikk er korrelasjon knyttet til avhengighetsbegrepet, som er den statistiske sammenhengen mellom to variabler
Pearsons korrelasjonskoeffisient eller bare korrelasjonskoeffisienten r er en verdi mellom -1 og 1 (-1≤r≤+1). Det er den mest brukte korrelasjonskoeffisienten og gyldig kun for et lineært forhold mellom variablene. Hvis r=0, eksisterer ingen sammenheng, og hvis r≥0, er sammenhengen direkte proporsjonal; verdien av en variabel øker med økningen i den andre. Hvis r≤0, er forholdet omvendt proporsjon alt; én variabel reduseres etter hvert som den andre øker.
På grunn av linearitetsbetingelsen kan korrelasjonskoeffisient r også brukes til å etablere tilstedeværelsen av en lineær sammenheng mellom variablene.
Spearmans rangkorrelasjonskoeffisient og Kendralls rangkorrelasjonskoeffisient måler styrken til forholdet, ekskludert den lineære faktoren. De vurderer graden av en variabel øker eller minker med den andre. Hvis begge variablene øker sammen, vil koeffisienten være positiv, og hvis en variabel øker mens den andre reduseres, vil koeffisientverdien være negativ.
Rangkorrelasjonskoeffisientene brukes bare for å fastslå typen av forholdet, men ikke for å undersøke i detalj som Pearsons korrelasjonskoeffisient. De brukes også til å redusere beregningene og gjøre resultatene mer uavhengige av unormaliteten til fordelingene som vurderes.
Hva er forskjellen mellom assosiasjon og korrelasjon?
• Assosiasjon refererer til den generelle sammenhengen mellom to stokastiske variabler mens korrelasjonen refererer til en mer eller mindre lineær sammenheng mellom de stokastiske variablene.
• Assosiasjon er et konsept, men korrelasjon er et mål på assosiasjon og matematiske verktøy er gitt for å måle størrelsen på korrelasjonen.
• Pearsons produktmomentkorrelasjonskoeffisient etablerer tilstedeværelsen av en lineær relasjon og bestemmer relasjonens natur (om de er proporsjonale eller omvendt proporsjonale).
• Rangekorrelasjonskoeffisienter brukes kun til å bestemme relasjonens natur, unntatt lineariteten til relasjonen (den kan være lineær eller ikke, men den vil fortelle om variablene øker sammen, reduseres sammen eller én øker mens den andre reduseres eller omvendt).