Forskjellen mellom RDBMS og Hadoop

Innholdsfortegnelse:

Forskjellen mellom RDBMS og Hadoop
Forskjellen mellom RDBMS og Hadoop

Video: Forskjellen mellom RDBMS og Hadoop

Video: Forskjellen mellom RDBMS og Hadoop
Video: Hadoop против РСУБД 2024, November
Anonim

Nøkkelforskjellen mellom RDBMS og Hadoop er at RDBMS lagrer strukturerte data mens Hadoop lagrer strukturerte, semistrukturerte og ustrukturerte data.

RDBMS er et databasestyringssystem basert på relasjonsmodellen. Hadoop er en programvare for lagring av data og kjøring av applikasjoner på klynger av råvaremaskinvare.

Bilde
Bilde

Hva er RDBMS?

RDBMS står for Relational Database Management System basert på relasjonsmodellen. I RDBMS brukes tabeller til å lagre data, og nøkler og indekser hjelper til med å koble sammen tabellene. En tabell er en samling av dataelementer, og de er enhetene. Den inneholder rader og kolonner. Radene representerer en enkelt oppføring i tabellen. Kolonnene representerer attributtene.

Salgsdatabasen kan for eksempel ha kunde- og produktenheter. Kunden kan ha attributter som kunde_id, navn, adresse, telefonnummer. Varen kan ha attributter som produkt_id, navn osv. Primærnøkkelen til kundetabellen er kunde_id mens primærnøkkelen til produkttabellen er produkt_id. Plassering av product_id i kundetabellen som en fremmednøkkel forbinder disse to enhetene. Likeledes er også tabellene relatert til hverandre. De gir dataintegritet, normalisering og mange flere. Få av de vanlige RDBMSene er MySQL, MSSQL og Oracle. De bruker SQL for spørringer.

Hva er Hadoop?

The Hadoop er et Apache åpen kildekode-rammeverk skrevet i Java. Det hjelper å lagre og behandle en stor mengde data på tvers av klynger av datamaskiner ved hjelp av enkle programmeringsmodeller. Hovedmålet til Hadoop er å lagre og behandle Big Data, som refererer til en stor mengde komplekse data. Gjennomstrømningen til Hadoop, som er kapasiteten til å behandle et volum av data innenfor en bestemt tidsperiode, er høy.

Forskjellen mellom RDBMS og Hadoop
Forskjellen mellom RDBMS og Hadoop

Det er fire moduler i Hadoop-arkitektur. De er Hadoop common, YARN, Hadoop Distributed File System (HDFS) og Hadoop MapReduce. Fellesmodulen inneholder Java-bibliotekene og verktøyene. Den har også filene for å starte Hadoop. Hadoop YARN utfører jobbplanlegging og klyngressursadministrasjon.

I tillegg er Hadoop Distributed File System (HDFS) Hadoop-lagringssystemet. Den bruker master-slave-arkitekturen. Masternoden er NameNode, og den administrerer filsystemets metadata. Andre datamaskiner er slavenoder eller DataNodes. De lagrer de faktiske dataene. På den annen side gjør Hadoop MapReduce den distribuerte beregningen. Den har algoritmene for å behandle dataene. I HDFS har masternoden en jobbsporer. Den kjører kartreduseringsjobber på slavenodene. Det er en oppgavesporing for hver slavenode for å fullføre databehandling og sende resultatet tilbake til masternoden. Tot alt sett gir Hadoop massiv lagring av data med høy prosessorkraft.

Hva er forskjellen mellom RDBMS og Hadoop?

RDBMS vs Hadoop

RDBMS er en systemprogramvare for å lage og administrere databaser som er basert på relasjonsmodellen. Hadoop er en samling åpen kildekode-programvare som kobler sammen mange datamaskiner for å løse problemer som involverer store mengder data og beregninger.
Datavariant
RDBMS lagrer strukturerte data. Hadoop lagrer strukturerte, semistrukturerte og ustrukturerte data.
Datalagring
RDBMS lagrer gjennomsnittlig datamengde. Hadoop lagrer en stor mengde data enn RDBMS.
Speed
I RDBMS er lesingen rask. I Hadoop går det raskt å lese og skrive.
Skalerbarhet
RDBMS har vertikal skalerbarhet. Hadoop har horisontal skalerbarhet.
Maskinvare
RDBMS bruker avanserte servere. Hadoop bruker råvaremaskinvare.
Gjennomstrømning
RDBMS-gjennomstrømning er høyere. Hadoop-gjennomstrømningen er lavere.

Sammendrag – RDBMS vs Hadoop

Denne artikkelen diskuterte forskjellen mellom RDBMS og Hadoop. Hovedforskjellen mellom RDBMS og Hadoop er at RDBMS lagrer strukturerte data mens Hadoop lagrer strukturerte, semistrukturerte og ustrukturerte data.

Anbefalt: