Dispersion vs Skewness
I statistikk og sannsynlighetsteori må ofte variasjonen i fordelingene uttrykkes på en kvantitativ måte for sammenligningsformål. Dispersjon og skjevhet er to statistiske begreper hvor formen på fordelingen presenteres i en kvantitativ skala.
Mer om Dispersion
I statistikk er spredningen variasjonen av en tilfeldig variabel eller dens sannsynlighetsfordeling. Det er et mål på hvor langt datapunktene ligger fra den sentrale verdien. For å uttrykke dette kvantitativt brukes spredningsmål i beskrivende statistikk.
Varians, standardavvik og interkvartilområde er de mest brukte målene for spredning.
Hvis dataverdiene har en bestemt enhet, på grunn av skalaen, kan spredningsmålene også ha de samme enhetene. Interdecil-område, Range, gjennomsnittlig forskjell, median absolutt avvik, gjennomsnittlig absolutt avvik og avstandsstandardavvik er mål på spredning med enheter.
Derimot finnes det spredningsmål som ikke har noen enheter, dvs. dimensjonsløse. Varians, variasjonskoeffisient, kvartil spredningskoeffisient og relativ gjennomsnittlig forskjell er mål for spredning uten enheter.
Spredning i et system kan stamme fra feil, som instrumentelle og observasjonsfeil. Også tilfeldige variasjoner i selve utvalget kan forårsake variasjoner. Det er viktig å ha en kvantitativ idé om variasjonen i data før du trekker andre konklusjoner fra datasettet.
Mer om skjevhet
I statistikk er skjevhet et mål på asymmetri i sannsynlighetsfordelingene. Skjevhet kan være positiv eller negativ, eller i noen tilfeller ikke-eksisterende. Det kan også betraktes som et mål på offset fra normalfordelingen.
Hvis skjevheten er positiv, er hoveddelen av datapunktene sentrert til venstre for kurven og høyre hale er lengre. Hvis skjevheten er negativ, er hoveddelen av datapunktene sentrert mot høyre for kurven og venstre hale er ganske lang. Hvis skjevheten er null, er populasjonen normalfordelt.
I en normalfordeling, det vil si når kurven er symmetrisk, har gjennomsnittet, medianen og modusen samme verdi. Hvis skjevheten ikke er null, holder ikke denne egenskapen, og gjennomsnittet, modusen og medianen kan ha forskjellige verdier.
Pearsons første og andre skjevhetskoeffisient brukes vanligvis for å bestemme skjevheten til distribusjonene.
Pearson's first skewness coffeicent=(gjennomsnittlig – modus) / (standardavvik)
Pearsons andre skjevhetskaffe=3(gjennomsnittlig – modus) / (satndard avvik)
I mer sensitive tilfeller brukes justert Fisher-Pearson standardisert momentkoeffisient.
G={n / (n-1)(n-2)} ∑i=1 ((y-ӯ)/s)3
Hva er forskjellen mellom spredning og skjevhet?
Spredning bekymringer om området som datapunktene er fordelt over, og skjevheten gjelder symmetrien til distribusjonen.
Begge mål for spredning og skjevhet er beskrivende mål, og skjevhetskoeffisient gir en indikasjon på formen på fordelingen.
Spredningsmål brukes for å forstå rekkevidden til datapunktene og forskyvning fra gjennomsnittet, mens skjevhet brukes for å forstå tendensen til variasjon av datapunkter i en bestemt retning.