Avvik vs standardavvik
Avvik vs standardavvik
I beskrivende og inferensiell statistikk brukes flere indekser for å beskrive et datasett som svarer til dets sentrale tendens, spredning og skjevhet. I statistisk slutning er disse ofte kjent som estimatorer siden de estimerer populasjonsparameterverdiene.
Spredning er et mål på spredningen av data rundt midten av datasettet. Standardavvik er et av de mest brukte målene for spredning. Avvikene til hvert datapunkt fra gjennomsnittet tas i betraktning ved beregning av standardavviket. Derfor kan man argumentere for at standardavviket sammen med gjennomsnittet vil gi et nesten tilstrekkelig bilde av et datasett.
Vurder følgende datasett. Vektene til 10 personer (i kilogram) er målt til å være 70, 62, 65, 72, 80, 70, 63, 72, 77 og 79. Da er gjennomsnittsvekten til de ti personene (i kilogram) 71 (i kilogram).).
Hva er avvik?
I statistikk betyr avvik hvor mye et enkelt datapunkt skiller seg fra en fast verdi som gjennomsnittet. Generelt, la k være en fast verdi og x1, x2, …, xn betegne en data sett. Deretter er avviket til xj fra k definert til å være (xj– k).
For eksempel, i datasettet ovenfor er de respektive avvikene fra gjennomsnittet (70 – 71)=-1, (62 – 71)=-9, (65 – 71)=-6, (72 – 71)=1, (80 – 71)=9, (70 – 71)=-1, (63 – 71)=-8, (72 – 71)=1, (77 – 71)=6 og (79 – 71)=8.
Hva er standardavvik?
Når data fra hele populasjonen kan tas i betraktning (for eksempel ved folketelling), er det mulig å beregne populasjonsstandardavviket. For å beregne standardavviket til populasjonen, beregnes først avvikene til dataverdier fra populasjonsgjennomsnittet. Rotgjennomsnittet (kvadratisk middel) av avvik kalles populasjonsstandardavviket. I symboler er σ=√{ ∑(xi-µ)2 / n} der µ er populasjonsgjennomsnittet og n er populasjonsstørrelsen.
Når data fra et utvalg (av størrelse n) brukes til å estimere parametere for populasjonen, beregnes utvalgets standardavvik. Først beregnes avvikene til dataverdiene fra prøvegjennomsnittet. Siden prøvegjennomsnittet brukes i stedet for populasjonsgjennomsnittet (som er ukjent), er det ikke hensiktsmessig å ta det kvadratiske gjennomsnittet. For å kompensere for bruken av utvalgets middelverdi divideres summen av kvadrater av avvik på (n-1) i stedet for n. Utvalgets standardavvik er kvadratroten av dette. I matematiske symboler er S=√{ ∑(xi-ẍ)2 / (n-1)}, der S er prøvestandardavviket, ẍ er prøvegjennomsnittet og xi-er er datapunktene.
I forrige datasett er summen av kvadrater av avvik (-1)2 + (-9)2 + (-6)2 + 12 + 92 + (-1) 2 + (-8)2 + 12 + 62 + 82=366. Dermed er populasjonsstandardavviket √(366/10)=6,05 (i kilo). (Forutsatt at befolkningen under vurdering består av de 10 personene som dataene ble hentet fra).
Hva er forskjellen mellom avvik og standardavvik?
• Standardavvik er en statistisk indeks og en estimator, men avvik er det ikke.
• Standardavvik er et mål på spredning av en klynge med data fra sentrum, mens avvik refererer til hvor mye et enkelt datapunkt skiller seg fra en fast verdi.