Forskjellen mellom sentral tendens og spredning

Forskjellen mellom sentral tendens og spredning
Forskjellen mellom sentral tendens og spredning

Video: Forskjellen mellom sentral tendens og spredning

Video: Forskjellen mellom sentral tendens og spredning
Video: GCSE Biology - What Is The Difference Between Light And Electron Microscopes? #6 2024, November
Anonim

Sentral tendens vs spredning

I beskrivende og inferensiell statistikk brukes flere indekser for å beskrive et datasett som tilsvarer dets sentrale tendens, spredning og skjevhet: de tre viktigste egenskapene som bestemmer den relative formen til fordelingen av et datasett.

Hva er sentral tendens?

Sentral tendens refererer til og lokaliserer sentrum for fordelingen av verdier. Gjennomsnitt, modus og median er de mest brukte indeksene for å beskrive den sentrale tendensen til et datasett. Hvis et datasett er symmetrisk, faller både medianen og gjennomsnittet av datasettet sammen med hverandre.

Gi et datasett, beregnes gjennomsnittet ved å ta summen av alle dataverdiene og deretter dele den med antall data. For eksempel er vekten til 10 personer (i kilo) målt til å være 70, 62, 65, 72, 80, 70, 63, 72, 77 og 79. Da kan gjennomsnittsvekten til de ti personene (i kilo) være beregnet som følger. Summen av vektene er 70 + 62 + 65 + 72 + 80 + 70 + 63 + 72 + 77 + 79=710. Gjennomsnitt=(sum) / (antall data)=710 / 10=71 (i kilo). Det er underforstått at uteliggere (datapunkter som avviker fra den normale trenden) har en tendens til å påvirke gjennomsnittet. I nærvær av uteliggere vil altså ikke gjennomsnittet alene gi et riktig bilde av midten av datasettet.

Medianen er datapunktet funnet i nøyaktig midten av datasettet. En måte å beregne medianen på er å sortere datapunktene i stigende rekkefølge, og deretter finne datapunktet i midten. For eksempel, hvis det en gang bestilt, ser det forrige datasettet slik ut, 62, 63, 65, 70, 70, 72, 72, 77, 79, 80. Derfor er (70+72)/2=71 i midten. Av dette ser man at median ikke trenger å være i datasettet. Medianen påvirkes ikke av tilstedeværelsen av uteliggere. Derfor vil medianen tjene som et bedre mål på sentral tendens i nærvær av uteliggere.

Modusen er den hyppigst forekommende verdien i settet med data. I forrige eksempel forekommer begge verdiene 70 og 72 to ganger, og begge er derfor moduser. Dette viser at det i noen distribusjoner er mer enn én modal verdi. Hvis det bare er én modus, sies datasettet å være unimod alt, i dette tilfellet er datasettet bimod alt.

Hva er spredning?

Spredning er mengden spredning av data om sentrum av distribusjonen. Rekkevidde og standardavvik er de mest brukte målene for spredning.

Rekkevidden er ganske enkelt den høyeste verdien minus den laveste verdien. I forrige eksempel er den høyeste verdien 80 og den laveste verdien er 62, så området er 80-62=18. Men området gir ikke et tilstrekkelig bilde av spredningen.

For å beregne standardavviket, beregnes først avvikene til dataverdiene fra gjennomsnittet. Rotkvadratgjennomsnittet av avvik kalles standardavviket. I forrige eksempel er de respektive avvikene fra gjennomsnittet (70 – 71)=-1, (62 – 71)=-9, (65 – 71)=-6, (72 – 71)=1, (80 – 71)=9, (70 – 71)=-1, (63 – 71)=-8, (72 – 71)=1, (77 – 71)=6 og (79 – 71)=8. Summen av kvadrater med avvik er (-1)2 + (-9)2 + (-6)2+ 12 + 92 + (-1)2 + (-8) 2 + 12 + 62 + 82=366 Standardavviket er √(366/10)=6,05 (i kilogram). Med mindre datasettet er sterkt skjevt, kan det ut fra dette konkluderes at flertallet av dataene er i intervallet 71±6,05, og det er det faktisk i dette spesielle eksemplet.

Hva er forskjellen mellom sentral tendens og spredning?

• Sentral tendens refererer til og lokaliserer sentrum for distribusjonen av verdier

• Spredning er mengden spredning av data om midten av et datasett.

Anbefalt: