Forskjellen mellom datautvinning og datavarehus

Forskjellen mellom datautvinning og datavarehus
Forskjellen mellom datautvinning og datavarehus

Video: Forskjellen mellom datautvinning og datavarehus

Video: Forskjellen mellom datautvinning og datavarehus
Video: 10 Budget Android Smartphones Bootanimation 2024, November
Anonim

Data mining vs Data Warehousing

Data Mining og Data Warehousing er både svært kraftige og populære teknikker for å analysere data. Brukere som er tilbøyelige til statistikk bruker Data Mining. De bruker statistiske modeller for å se etter skjulte mønstre i data. Data miners er interessert i å finne nyttige relasjoner mellom ulike dataelementer, noe som til syvende og sist er lønnsomt for bedrifter. Men på den annen side har dataeksperter som kan analysere dimensjoner av virksomheten direkte en tendens til å bruke datavarehus.

Data mining er også kjent som Knowledge Discovery in data (KDD). Som nevnt ovenfor er det et felt innen informatikk, som omhandler utvinning av tidligere ukjent og interessant informasjon fra rådata. På grunn av den eksponentielle veksten av data, spesielt innen områder som forretninger, har datautvinning blitt et svært viktig verktøy for å konvertere denne store mengde data til forretningsintelligens, ettersom manuell utvinning av mønstre har blitt tilsynelatende umulig de siste tiårene. For eksempel er det i dag blitt brukt til ulike applikasjoner som sosiale nettverksanalyser, svindeloppdagelse og markedsføring. Data mining omhandler vanligvis følgende fire oppgaver: klynging, klassifisering, regresjon og assosiasjon. Clustering er å identifisere lignende grupper fra ustrukturerte data. Klassifisering er læringsregler som kan brukes på nye data og vil typisk inkludere følgende trinn: forbehandling av data, design av modellering, læring/funksjonsvalg og evaluering/validering. Regresjon er å finne funksjoner med minimal feil for å modellere data. Og assosiasjon ser etter sammenhenger mellom variabler. Data mining brukes vanligvis til å svare på spørsmål som hva er hovedproduktene som kan bidra til å oppnå høy fortjeneste neste år i Wal-Mart?

Som nevnt ovenfor, brukes datavarehus også for å analysere data, men av ulike sett med brukere og et litt annet mål i tankene. Når det for eksempel gjelder detaljhandelen, er datavarehusbrukere mer opptatt av hva slags kjøp som er populære blant kundene, så resultatene av analysen kan hjelpe kunden ved å forbedre kundeopplevelsen. Men datagruvearbeidere antar først en hypotese som hvilke kunder som kjøper en bestemt type produkt og analyserer dataene for å teste hypotesen. Datavarehus kan utføres av en stor forhandler som i utgangspunktet lagerfører butikkene sine med samme størrelser på produkter for senere å finne ut at New York-butikker selger mindre varelager mye raskere enn i Chicago-butikker. Så ved å se på dette resultatet kan forhandleren lagerføre New York-butikken med mindre størrelser sammenlignet med Chicago-butikker.

Så, som du tydelig kan se, ser disse to typene analyser ut til å være av samme natur for det blotte øye. Begge bekymrer seg for å øke fortjenesten basert på historiske data. Men selvfølgelig er det viktige forskjeller. Enkelt sagt, Data Mining og Data Warehousing er dedikert til å levere forskjellige typer analyser, men definitivt for forskjellige typer brukere. Med andre ord, Data Mining ser etter korrelasjoner, mønstre for å støtte en statistisk hypotese. Men Data Warehousing svarer på et relativt bredere spørsmål og deler opp data derfra og utover for å gjenkjenne måter å forbedre på i fremtiden.

Anbefalt: