XML vs HTML
XML står for EXtensible Markup Language. Det er definert i XML 1.0-spesifikasjonen, som er utviklet av W3C (World Wide Web Consortium). XML gir en standard måte, som også er enkel, å kode data og tekst slik at innholdet kan utveksles på tvers av drivermaskinvare, operativsystemer og applikasjoner med lite menneskelig innblanding. HyperText Markup Language, kjent som HTML, er også et ledende merkespråk for nettsider. HTML er den grunnleggende byggesteinen til nettsider. Nettleser leser HTML-dokumentet og setter dem sammen til visuelle eller hørbare nettsider.
XML
XML er et markup-språk som brukes til å overføre data og tekst mellom drivermaskinvare, operativsystemer og applikasjoner med lite menneskelig innblanding. XML gir tagger, attributter og elementstrukturer som kan brukes til å gi kontekstinformasjon. Denne kontekstinformasjonen kan brukes til å dekode betydningen av innholdet. Dette gjør det mulig å utvikle effektive søkemotorer og utføre data mining på dataene. Videre er tradisjonelle relasjonsdatabaser egnet som XML-data fordi de kan organiseres i rader og kolonner, men XML gir mindre støtte for data med rikt innhold som lyd, video, komplekse dokumenter osv. XML-databaser lagrer data i en strukturert, hierarkisk form som gjør at spørsmål kan behandles mer effektivt. XML-tagger er ikke forhåndsdefinerte og brukerne kan definere nye tagger og dokumentstrukturer. Nye internettspråk som RSS, Atom, SOAP og XHTM ble også opprettet ved hjelp av XML.
HTML
HTML som nevnt tidligere er et markup-språk som har et sett med markup-tagger. HTML-merkekoder, som vanligvis kalles HTML-koder, brukes til å beskrive nettsider. Typiske HTML-dokumenter inneholder HTML-koder så vel som ren tekst som kreves for innholdet på nettsider. HTML-koder kan lett identifiseres i et HTML-dokument siden de er omgitt av vinkelparenteser (f.eks.). HTML-tagger settes vanligvis inn i et dokument i par, der den første taggen er startkoden (f.eks. ) og den andre taggen er sluttkoden (f.eks.). Oppgaven til en nettleser (f.eks. Internet Explorer, Firefox, etc.) er å lese et HTML-dokument og vise det som en nettside. Nettleseren bruker HTML-taggene til å tolke innholdet på siden, men selve HTML-taggene vises ikke av nettleseren. HTML-sider kan legge inn bilder, objekter og skript skrevet på språk som JavaScript. Dessuten kan HTML brukes til å lage interaktive skjemaer.
Forskjellen mellom XML og HTML
Selv om XML og HTML begge er markup-språk, er det noen grunnleggende forskjeller mellom dem. HTML består hovedsakelig av tagger som definerer utseendet til innholdet, mens XML-tagger generelt definerer strukturen og innholdet i data (og det faktiske utseendet er definert av et tilknyttet stilark). For det andre kan XML utvides, siden XML-taggene kan defineres av brukeren for en spesifikk applikasjon, mens HTML-taggene er definert av W3C.