Varians vs Covariance
Varians og kovarians er to mål som brukes i statistikk. Varians er et mål på spredningen av dataene, og kovarians indikerer graden av endring av to tilfeldige variabler sammen. Varians er snarere et intuitivt konsept, men kovarians er definert matematisk i ikke så intuitivt i begynnelsen.
Mer om Variance
Varians er et mål på spredning av dataene fra middelverdien til fordelingen. Den forteller hvor langt datapunktene ligger fra gjennomsnittet av fordelingen. Det er en av de primære beskrivelsene av sannsynlighetsfordelingen og et av momentene for fordelingen. Varians er også en parameter for populasjonen, og variansen til et utvalg fra populasjonen fungerer som en estimator for variansen til populasjonen. Fra ett perspektiv er det definert som kvadratet av standardavviket.
I klartekst kan det beskrives som gjennomsnittet av kvadratene av avstanden mellom hvert datapunkt og gjennomsnittet av fordelingen. Følgende formel brukes til å beregne variansen.
Var(X)=E[(X-µ)2] for en befolkning, og
Var(X)=E[(X-‾x)2] for et eksempel
Det kan forenkles ytterligere å gi Var(X)=E[X2]-(E[X])2.
Variance har noen signaturegenskaper, og brukes ofte i statistikk for å gjøre bruken enklere. Varians er ikke-negativ fordi det er kvadratet av avstandene. Imidlertid er variansens rekkevidde ikke begrenset og avhenger av den spesielle fordelingen. Variansen til en konstant tilfeldig variabel er null, og variansen endres ikke med hensyn til en plasseringsparameter.
Mer om samvariasjon
I statistisk teori er kovarians et mål på hvor mye to tilfeldige variabler endres sammen. Med andre ord er kovarians et mål på styrken til korrelasjonen mellom to tilfeldige variabler. Det kan også betraktes som en generalisering av konseptet med varians for to tilfeldige variabler.
Kovarians av to stokastiske variabler X og Y, som er felles fordelt med endelig sekundært momentum, er kjent som σXY=E[(X-E[X])(Y-E[Y])]. Ut fra dette kan varians sees på som et spesielt tilfelle av kovarians, hvor to variabler er like. Cov(X, X)=Var(X)
Ved å normalisere kovariansen kan den lineære korrelasjonskoeffisienten eller Pearsons korrelasjonskoeffisient oppnås, som er definert som ρ=E[(X-E[X])(Y-E[Y])]/(σ X σY)=(Cov(X, Y))/(σX σY )
Grafisk kan kovarians mellom et par datapunkter sees på som arealet av rektangelet med datapunktene i motsatte hjørner. Det kan tolkes som et mål på størrelsen på separasjonen mellom de to datapunktene. Med tanke på rektanglene for hele populasjonen, kan overlappingen av rektanglene som tilsvarer alle datapunktene betraktes som styrken til separasjonen; variansen til de to variablene. Kovarians er i to dimensjoner, på grunn av to variabler, men å forenkle den til én variabel gir variansen til en enkelt som separasjonen i én dimensjon.
Hva er forskjellen mellom varians og kovarians?
• Varians er målet på spredning/spredning i en populasjon mens kovarians betraktes som et mål på variasjon av to tilfeldige variabler eller styrken på korrelasjonen.
• Varians kan betraktes som et spesielt tilfelle av kovarians.
• Varians og kovarians er avhengig av størrelsen på dataverdiene, og kan ikke sammenlignes; derfor er de normalisert. Kovarians normaliseres til korrelasjonskoeffisienten (divisjon med produktet av standardavvikene til de to tilfeldige variablene) og variansen normaliseres til standardavviket (ved å ta kvadratroten)