Parametrisk kontra ikke-parametrisk
Statistikk er en gren av studier som lar oss forstå populasjonsdynamikk ved å bruke prøver hentet fra en bestemt populasjon av interesse. Det er viktig at disse prøvene er tilfeldige. Mange formler er laget med inkorporering av matematikk, for å ta slutninger om populasjonsparametere. Naturligvis kan enhver populasjon ha en "normalfordeling" der spredningen av data/prøver har form som en bjelle i frekvensgrafen. I en normalfordeling konsentrerer de fleste prøvene seg rundt gjennomsnitt og 68 %, 95 %, 99 % av dataene finnes innenfor henholdsvis 1, 2 og 3 standardavvik. Parametrisk og ikke-parametrisk statistikk avhenger av om normalfordeling vurderes eller ikke.
Hva er parametrisk statistikk?
Parametrisk statistikk er statistikken der data/utvalg anses som hentet fra en normalfordeling. Definisjonen av parametrisk statistikk er "statistikken som antar at dataene kommer fra en type sannsynlighetsfordeling og trekker slutninger om parametrene til fordelingen". De fleste kjente elementære statistiske metodene tilhører denne gruppen. I virkeligheten er de kanskje ikke normalfordelt. Derfor er denne statistikktypen basert på flere forutsetninger. Hvis dataene/prøvene er normalfordelt eller nesten normalfordelt, kan formlene gi nøyaktige resultater og slutninger. Men hvis antakelsen om å være normalfordelt er feil, kan parametrisk statistikk være ganske misvisende.
Hva er ikke-parametrisk statistikk?
Ikke-parametrisk statistikk er også kjent som distribusjonsfri statistikk. Fordelen med denne statistikktypen er at den ikke trenger å gjøre en antagelse som tidligere gjort med parametere. Ikke-parametriske statistiske beregninger tar medianer i oppmerksomhet enn gjennomsnittet. Derfor, hvis en eller to avviker fra middelverdien, neglisjeres effekten deres. Generelt foretrekkes parametrisk statistikk enn dette fordi den har større makt til å avvise en falsk hypotese enn ikke-parametrisk metode. En av de mest kjente ikke-parametriske testene er Chi-square test. Det finnes ikke-parametriske analoger for noen parametriske tester som Wilcoxon T Test for paret prøve t-test, Mann-Whitney U Test for uavhengige prøver t-test, Spearmans korrelasjon for Pearsons korrelasjon osv. For én prøve t-test er det ingen sammenlignbar ikke-parametrisk test.
Hva er forskjellen mellom parametrisk og ikke-parametrisk?
• Parametrisk statistikk avhenger av normalfordeling, men ikke-parametrisk statistikk er ikke avhengig av normalfordeling.
• Parametrisk statistikk gjør flere forutsetninger enn ikke-parametrisk statistikk.
• Parametrisk statistikk bruker enklere formler sammenlignet med ikke-parametrisk statistikk.
• Når en populasjon antas å være normalfordelt eller nær normalfordelt, er parametrisk statistikk den beste å bruke. Hvis ikke, er det best at en ikke-parametrisk metode brukes.
• De fleste av de allment kjente elementære statistikkmetodene tilhører parametrisk statistikk. Ikke-parametrisk statistikk brukes sparsomt og brukes for spesielle tilfeller.