binomial vs normal distribusjon
Sannsynlighetsfordelinger av tilfeldige variabler spiller en viktig rolle innen statistikk. Av disse sannsynlighetsfordelingene er binomialfordeling og normalfordeling to av de mest forekommende i det virkelige liv.
Hva er binomialfordeling?
Binomialfordeling er sannsynlighetsfordelingen som tilsvarer den tilfeldige variabelen X, som er antall suksesser for en endelig sekvens av uavhengige ja/nei-eksperimenter som hver har en sannsynlighet for suksess p. Fra definisjonen av X er det tydelig at det er en diskret tilfeldig variabel; derfor er binomialfordeling også diskret.
Fordelingen er angitt som X ~ B (n, p) der n er antall eksperimenter og p er sannsynligheten for suksess. I følge sannsynlighetsteori kan vi utlede at B (n, p) følger sannsynlighetsmassefunksjonen [latex] B(n, p)\\sim \\binom{n}{k} p^{k} (1-p)^{(n-k)}, k=0, 1, 2, …n [/latex]. Fra denne ligningen kan det videre utledes at den forventede verdien av X, E(X)=np og variansen til X, V(X)=np (1- p).
Vurder for eksempel et tilfeldig eksperiment med å kaste en mynt 3 ganger. Definer suksess som å oppnå H, fiasko som å oppnå T og tilfeldig variabel X som antall suksesser i eksperimentet. Deretter X ~ B (3, 0,5) og sannsynlighetsmassefunksjonen til X gitt av [latex] \binom{3}{k} 0.5^{k} (0,5)^{(3-k)}, k=0, 1, 2.[/latex]. Derfor er sannsynligheten for å oppnå minst 2 H-er P(X ≥ 2)=P (X=2 eller X=3)=P (X=2) + P (X=3)=3 C2(0,52)(0,51) + 3 C3(0,53)(0,50)=0,375 + 0,125=0,5.
Hva er normalfordeling?
Normalfordeling er den kontinuerlige sannsynlighetsfordelingen definert av sannsynlighetstetthetsfunksjonen, [latex] N(\mu, \\sigma)\\sim\\frac{1}{\sqrt{2 \\pi \\sigma^{2}}} / e^{- \\frac{(x-\\mu)^{2}}{2 \\sigma^{2}}} [/latex]. Parametrene [latex] \mu og \\sigma [/latex] angir gjennomsnittet og standardavviket til populasjonen av interesse. Når [latex] \mu=0 og \\sigma=1 [/latex] kalles fordelingen standard normalfordeling.
Denne fordelingen kalles normal siden de fleste av naturfenomenene følger normalfordelingen. For eksempel er IQen til den menneskelige befolkningen normalfordelt. Som sett fra grafen er den unimodal, symmetrisk om gjennomsnittet og klokkeformet. Gjennomsnitt, modus og median er sammenfallende. Arealet under kurven tilsvarer andelen av befolkningen som tilfredsstiller en gitt betingelse.
Andelene av populasjonen i intervallet [latex] (\mu – \\sigma, \\mu + \\sigma) [/latex], [latex] (\mu – 2 \\sigma, \\mu + 2 \\sigma) [/latex], [latex] (\mu – 3 \\sigma, \\mu + 3 \\sigma) [/latex] er omtrent 68,2 %, 95,6 % og 99,8 % hhv.
Hva er forskjellen mellom binomial- og normaldistribusjoner?
- Binomialfordeling er en diskret sannsynlighetsfordeling, mens normalfordelingen er en kontinuerlig.
- Sannsynlighetsmassefunksjonen til binomialfordelingen er [latex]B(n, p)\\sim \\binom{n}{k} p^{k} (1-p)^{(n-k) } [/latex], mens sannsynlighetstetthetsfunksjonen til normalfordelingen er [latex] N(\mu, \\sigma)\\sim\\frac{1}{\sqrt{2 \\pi \\sigma ^{2}}} / e^{- \\frac{(x-\\mu)^{2}}{2 \\sigma^{2}}} [/latex]
- Binomialfordeling er tilnærmet med normalfordeling under visse forhold, men ikke omvendt.