Forskjellen mellom lineær og logistisk regresjon

Forskjellen mellom lineær og logistisk regresjon
Forskjellen mellom lineær og logistisk regresjon

Video: Forskjellen mellom lineær og logistisk regresjon

Video: Forskjellen mellom lineær og logistisk regresjon
Video: Forskjeller mellom britisk og amerikansk 2024, November
Anonim

Lineær vs logistisk regresjon

I statistisk analyse er det viktig å identifisere sammenhengene mellom variabler som er berørt av studien. Noen ganger kan det være det eneste formålet med selve analysen. Et sterkt verktøy som brukes for å fastslå eksistensen av relasjoner og identifisere relasjonen er regresjonsanalyse.

Den enkleste formen for regresjonsanalyse er lineær regresjon, der relasjonen mellom variablene er en lineær sammenheng. I statistiske termer får den frem forholdet mellom forklaringsvariabelen og responsvariabelen. Ved å bruke regresjon kan vi for eksempel etablere sammenhengen mellom vareprisen og forbruket basert på data samlet inn fra et tilfeldig utvalg. Regresjonsanalyse vil produsere en regresjonsfunksjon av datasettet, som er en matematisk modell som passer best til tilgjengelige data. Dette kan lett representeres av et spredningsplott. Grafisk sett tilsvarer regresjon å finne den beste tilpasningskurven for det gitte datasettet. Funksjonen til kurven er regresjonsfunksjonen. Ved å bruke den matematiske modellen kan bruken av en vare forutses for en gitt pris.

Derfor er regresjonsanalysen mye brukt i prediksjon og prognoser. Det brukes også til å etablere sammenhenger i eksperimentelle data, innen fysikk, kjemi og i mange naturvitenskapelige og ingeniørfaglige disipliner. Hvis forholdet eller regresjonsfunksjonen er en lineær funksjon, er prosessen kjent som en lineær regresjon. I spredningsplottet kan det representeres som en rett linje. Hvis funksjonen ikke er en lineær kombinasjon av parameterne, er regresjonen ikke-lineær.

Logistisk regresjon er sammenlignbar med multivariat regresjon, og den lager en modell for å forklare virkningen av flere prediktorer på en responsvariabel. I logistisk regresjon bør imidlertid sluttresultatvariabelen være kategorisk (vanligvis delt; det vil si et par oppnåelige utfall, som død eller overlevelse, selv om spesielle teknikker gjør det mulig å modellere mer kategorisert informasjon). En kontinuerlig utfallsvariabel kan transformeres til en kategorisk variabel, som skal brukes til logistisk regresjon; Imidlertid frarådes det å kollapse kontinuerlige variabler på denne måten fordi det reduserer nøyaktigheten.

I motsetning til i den lineære regresjonen, mot gjennomsnittet, trenger ikke prediktorvariablene i logistisk regresjon å være tvunget til å være lineært koblet, fellesfordelt, eller å ha lik varians i hver klynge. Som et resultat er forholdet mellom prediktoren og utfallsvariablene sannsynligvis ikke en lineær funksjon.

Hva er forskjellen mellom logistisk og lineær regresjon?

• I lineær regresjon antas en lineær relasjon mellom forklaringsvariabelen og responsvariabelen, og parametere som tilfredsstiller modellen blir funnet ved analyse, for å gi den nøyaktige sammenhengen.

• Lineær regresjon utføres for kvantitative variabler, og den resulterende funksjonen er en kvantitativ.

• I den logistiske regresjonen kan data som brukes enten være kategoriske eller kvantitative, men resultatet er alltid kategorisk.

Anbefalt: