DBMS vs Data Mining
A DBMS (Database Management System) er et komplett system som brukes til å administrere digitale databaser som tillater lagring av databaseinnhold, opprettelse/vedlikehold av data, søk og andre funksjoner. På den annen side er Data Mining et felt innen informatikk, som omhandler utvinning av tidligere ukjent og interessant informasjon fra rådata. Vanligvis lagres dataene som brukes som input for Data mining-prosessen i databaser. Brukere som er tilbøyelige til statistikk bruker Data Mining. De bruker statistiske modeller for å se etter skjulte mønstre i data. Data miners er interessert i å finne nyttige relasjoner mellom ulike dataelementer, noe som til syvende og sist er lønnsomt for bedrifter.
DBMS
DBMS, noen ganger bare k alt en databasebehandler, er en samling dataprogrammer som er dedikert for administrasjon (dvs. organisering, lagring og gjenfinning) av alle databaser som er installert i et system (dvs. harddisk eller nettverk). Det finnes forskjellige typer databasestyringssystemer i verden, og noen av dem er designet for riktig administrasjon av databaser konfigurert for spesifikke formål. De mest populære kommersielle databaseadministrasjonssystemer er Oracle, DB2 og Microsoft Access. Alle disse produktene gir mulighet for tildeling av ulike nivåer av privilegier for ulike brukere, noe som gjør det mulig for et DBMS å bli kontrollert sentr alt av en enkelt administrator eller tildeles flere ulike personer. Det er fire viktige elementer i ethvert databasestyringssystem. De er modelleringsspråket, datastrukturene, spørringsspråket og mekanismen for transaksjoner. Modelleringsspråket definerer språket til hver database som er vert i DBMS. For tiden er flere populære tilnærminger som hierarkisk, nettverk, relasjonell og objekt i praksis. Datastrukturer hjelper til med å organisere dataene som individuelle poster, filer, felt og deres definisjoner og objekter som visuelle medier. Dataspørringsspråk opprettholder sikkerheten til databasen ved å overvåke påloggingsdata, tilgangsrettigheter til forskjellige brukere og protokoller for å legge til data til systemet. SQL er et populært spørrespråk som brukes i relasjonelle databasestyringssystemer. Til slutt hjelper mekanismen som tillater transaksjoner samtidighet og mangfold. Denne mekanismen vil sørge for at den samme posten ikke vil bli endret av flere brukere samtidig, og dermed holde dataintegriteten i takt. I tillegg tilbyr DBMS backup og andre fasiliteter.
Data Mining
Data mining er også kjent som Knowledge Discovery in Data (KDD). Som nevnt ovenfor, er det et felt innen informatikk, som omhandler utvinning av tidligere ukjent og interessant informasjon fra rådata. På grunn av den eksponentielle veksten av data, spesielt innen områder som forretninger, har datautvinning blitt et svært viktig verktøy for å konvertere denne store mengde data til forretningsintelligens, ettersom manuell utvinning av mønstre har blitt tilsynelatende umulig de siste tiårene. For eksempel er det i dag blitt brukt til ulike applikasjoner som sosiale nettverksanalyser, svindeloppdagelse og markedsføring. Data mining omhandler vanligvis følgende fire oppgaver: klynging, klassifisering, regresjon og assosiasjon. Clustering er å identifisere lignende grupper fra ustrukturerte data. Klassifisering er læringsregler som kan brukes på nye data og vil typisk inkludere følgende trinn: forbehandling av data, design av modellering, læring/funksjonsvalg og evaluering/validering. Regresjon er å finne funksjoner med minimal feil for å modellere data. Og assosiasjon ser etter sammenhenger mellom variabler. Data mining brukes vanligvis til å svare på spørsmål som hva er hovedproduktene som kan bidra til å oppnå høy fortjeneste neste år i Wal-Mart?
Hva er forskjellen mellom DBMS og Data mining?
DBMS er et fullverdig system for å huse og administrere et sett med digitale databaser. Data Mining er imidlertid en teknikk eller et konsept innen informatikk, som omhandler å trekke ut nyttig og tidligere ukjent informasjon fra rådata. Oftest er disse rådataene lagret i veldig store databaser. Derfor bruker dataminere de eksisterende funksjonene til DBMS for å håndtere, administrere og til og med forhåndsbehandle rådata før og under datautvinningsprosessen. Et DBMS-system alene kan imidlertid ikke brukes til å analysere data. Men noen DBMS har for tiden innebygde dataanalyseverktøy eller -funksjoner.