Korrelasjon vs kovarians
Korrelasjon og kovarians er nært beslektede begreper i teoretisk statistikk. De er viktige for å bestemme forholdet mellom to tilfeldige variabler.
Hva er korrelasjon?
Korrelasjon er et mål på styrken til sammenhengen mellom to variabler. Korrelasjonskoeffisienten kvantifiserer graden av endring av en variabel basert på endringen av den andre variabelen. I statistikk er korrelasjon knyttet til avhengighetsbegrepet, som er den statistiske sammenhengen mellom to variabler
Pearsons korrelasjonskoeffisient eller bare korrelasjonskoeffisienten r er en verdi mellom -1 og 1 (-1≤r≤+1). Det er den mest brukte korrelasjonskoeffisienten og gyldig kun for et lineært forhold mellom variablene. Hvis r=0 eksisterer ingen sammenheng, og hvis r≥0 er sammenhengen direkte proporsjonal; verdien av en variabel øker med økningen av den andre. Hvis r≤0 er forholdet omvendt proporsjon alt; én variabel reduseres etter hvert som den andre øker.
På grunn av linearitetsbetingelsen kan korrelasjonskoeffisient r også brukes til å etablere tilstedeværelsen av en lineær sammenheng mellom variablene.
Hva er kovarians?
I statistisk teori er kovarians et mål på hvor mye to tilfeldige variabler endres sammen. Med andre ord er kovarians et mål på styrken til korrelasjonen mellom to tilfeldige variabler.
I et annet perspektiv kan man se at korrelasjon bare er den normaliserte versjonen av kovarians, hvor kovariansen deles på produktet av standardavvikene til de to tilfeldige variablene. Omfanget av kovarians kan være stort; derfor er det ikke lett å sammenligne. Denne vanskeligheten overvinnes ved å bringe kovariansverdiene til et område der det kan sammenlignes ved å normalisere det (somt sett hva z-score gjør). Selv om kovariansen og variansen er knyttet til hverandre på ovennevnte måte, er sannsynlighetsfordelingene deres ikke knyttet til hverandre på en enkel måte og må behandles separat.
Hva er forskjellen mellom korrelasjon og kovarians?
• Både korrelasjon og kovarians er mål på relasjonen mellom to tilfeldige variabler. Korrelasjon er et mål på styrken til lineariteten til de to variablene og kovarians er et mål på styrken til korrelasjonen.
• Korrelasjonskoeffisientverdier er en verdi mellom -1 og +1, mens kovariansområdet ikke er konstant, men kan enten være positivt eller negativt. Men hvis de tilfeldige variablene er standardisert før kovariansen beregnes, er kovariansen lik korrelasjonen og har en verdi mellom -1 og +1.