Nøkkelforskjellen mellom klassifisering og regresjonstre er at i klassifisering er de avhengige variablene kategoriske og uordnede, mens i regresjon er de avhengige variablene kontinuerlige eller ordnede hele verdier.
Klassifisering og regresjon er læringsteknikker for å lage modeller for prediksjon fra innsamlede data. Begge teknikkene presenteres grafisk som klassifiserings- og regresjonstrær, eller snarere flytskjemaer med inndelinger av data etter hvert trinn, eller rettere sagt, "gren" i treet. Denne prosessen kalles rekursiv partisjonering. Felt som Mining bruker disse klassifiserings- og regresjonslæringsteknikkene. Denne artikkelen fokuserer på klassifiseringstreet og regresjonstreet.
Hva er klassifisering?
Klassifisering er en teknikk som brukes for å komme frem til et skjema som viser organiseringen av data som starter med en forløpervariabel. De avhengige variablene er det som klassifiserer dataene.
Figur 01: Datautvinning
Klassifiseringstreet starter med den uavhengige variabelen, som forgrener seg i to grupper som bestemmes av de eksisterende avhengige variablene. Det er ment å belyse svarene i form av kategorisering forårsaket av de avhengige variablene.
Hva er regresjon
Regresjon er en prediksjonsmetode som er basert på en antatt eller kjent numerisk utdataverdi. Denne utgangsverdien er resultatet av en serie rekursiv partisjonering, der hvert trinn har én numerisk verdi og en annen gruppe avhengige variabler som forgrener seg til et annet par som dette.
Regresjonstreet starter med en eller flere forløpervariabler og avsluttes med en endelig utdatavariabel. De avhengige variablene er enten kontinuerlige eller diskrete numeriske variabler.
Hva er forskjellen mellom klassifisering og regresjon?
Klassifisering vs regresjon |
|
En tremodell der målvariabelen kan ta et diskret sett med verdier. | En tremodell der målvariabelen kan ta kontinuerlige verdier, vanligvis reelle tall. |
avhengig variabel | |
For klassifiseringstreet er de avhengige variablene kategoriske. | For regresjonstre er de avhengige variablene numeriske. |
Verdier | |
Har et angitt antall uordnede verdier. | Har enten diskrete ennå ordnede verdier eller indiskrete verdier. |
Konstruksjonsformål | |
Formålet med å konstruere regresjonstreet er å tilpasse et regresjonssystem til hver determinantgren på en måte som gjør at den forventede utgangsverdien kommer opp. | Et klassifiseringstre forgrener seg som bestemt av en avhengig variabel avledet fra forrige node. |
Sammendrag – Klassifisering vs Regresjon
Regresjons- og klassifiseringstrær er nyttige teknikker for å kartlegge prosessen som peker på et studert utfall, enten det er i klassifisering eller en enkelt tallverdi. Forskjellen mellom klassifiseringstreet og regresjonstreet er deres avhengige variabel. Klassifikasjonstrær har avhengige variabler som er kategoriske og uordnede. Regresjonstrær har avhengige variabler som er kontinuerlige verdier eller ordnede hele verdier.