Sample vs Population
Population og Sample er to viktige termer i faget «Statistikk». Enkelt sagt er populasjonen den største samlingen av gjenstander vi er interessert i å studere, og utvalget er en undergruppe av en populasjon. Med andre ord bør utvalget representere populasjonen med færre men tilstrekkelig antall elementer. Én populasjon kan ha flere utvalg med forskjellige størrelser.
Sample
Et utvalg kan bestå av to eller flere elementer som er valgt ut av populasjonen. Den laveste mulige størrelsen for et utvalg er to, og den høyeste vil være lik størrelsen på populasjonen. Det er flere måter å velge et utvalg fra en populasjon på. Teoretisk sett er det å velge et "tilfeldig utvalg" den beste måten å oppnå nøyaktige slutninger om populasjonen. Denne typen utvalg kalles også sannsynlighetsutvalg, ettersom hvert element i populasjonen har like muligheter til å bli inkludert i et utvalg.
‘Simple random sampling’-teknikk er den mest kjente tilfeldige prøvetakingsteknikken. I dette tilfellet velges elementer som skal velges for utvalget tilfeldig fra populasjonen. En slik prøve kalles en "Simple Random Sample" eller SRS. En annen populær teknikk er "systematisk prøvetaking". I dette tilfellet velges varene for en prøve basert på en bestemt systematisk rekkefølge.
Eksempel: Hver 10. person i køen blir valgt ut for en prøve.
I dette tilfellet er den systematiske rekkefølgen hver 10. person. Statistikeren står fritt til å definere denne rekkefølgen på en meningsfull måte. Det finnes andre tilfeldige prøvetakingsteknikker som klyngeprøvetaking eller stratifisert prøvetaking, og utvelgelsesmetoden er litt forskjellig fra de to ovenfor.
For praktiske formål kan ikke-tilfeldige prøver som bekvemmelighetsprøver, skjønnsprøver, snøballprøver og formålsprøver brukes. Dessuten, elementer valgt til en ikke-tilfeldig prøve er knyttet til en sjanse. Faktisk har ikke hvert element i populasjonen lik mulighet til å bli inkludert i et ikke-tilfeldig utvalg. Disse typene samples kalles også ikke-sannsynlighetsprøver.
Befolkning
Enhver samling av enheter som er interessante å undersøke er ganske enkelt definert som «populasjon». Populasjon er grunnlaget for utvalg. Ethvert sett med objekter i universet kan være en populasjon, basert på studieerklæringen. Generelt bør en populasjon være relativt stor i størrelse og vanskelig å utlede noen egenskaper ved å vurdere elementene individuelt. Målingene som skal undersøkes i populasjonen kalles parametere. I praksis estimeres parametrene ved å bruke statistikk som er de relevante målingene av utvalget.
Eksempel: Når du estimerer gjennomsnittlig matematikkkarakter for 30 elever i en klasse fra gjennomsnittlig matematikkkarakter på 5 elever, er parameteren gjennomsnittlig matematikkkarakter for klassen. Statistikken er gjennomsnittlig matematikkkarakter for 5 elever.
Sample vs Population
Det interessante forholdet mellom utvalget og populasjonen er at populasjonen kan eksistere uten et utvalg, men at utvalget kanskje ikke eksisterer uten populasjonen. Dette argumentet beviser videre at et utvalg avhenger av en populasjon, men interessant nok avhenger de fleste av populasjonsslutningene av utvalget. Hovedformålet med et utvalg er å estimere eller utlede noen målinger av en populasjon så nøyaktig som mulig. En høyere nøyaktighet kan utledes fra det samlede resultatet oppnådd fra flere prøver av samme populasjon i stedet for fra ett utvalg. En annen viktig ting å vite er at når du velger mer enn ett utvalg fra en populasjon, kan ett element også inkluderes i et annet utvalg. Denne saken er kjent som "prøver med erstatninger". Dessuten er det å investere de relevante målingene av populasjonen fra en prøve og oppnå nesten lik produksjon en gylden mulighet til å spare kostnadene og tidsverdien.
Det er avgjørende å vite at når utvalgsstørrelsen øker, øker også nøyaktigheten av estimatet for populasjonsparameteren. Logisk, for å ha bedre estimater for populasjonen, bør ikke utvalgsstørrelsen være for liten. Videre bør tilfeldige utvalg også vurderes å ha bedre estimater. Derfor er det avgjørende å ta hensyn til størrelsen og tilfeldigheten til utvalget for å være representativt for å få beste estimater for populasjonen.