XML
XML (Rozšiřitelný značkovací jazyk) je W3C doporučení pro vytvářet specialitu-účelové značkovací jazyky. To je zjednodušená podmnožina SGML, schopný popisovat mnoho různých druhů dat. Jeho primární účel má usnadnit sdílení uspořádaného textu a informace přes Internet. Jazyky založené na XML (například, RDF, SMIL, MathML, XSIL a SVG) být sám popsali ve formální cestě, dovolit programům upravit a potvrdit dokumenty v těchto jazycích bez předchozí znalosti jejich formy.
Síly a slabosti
Rysy XML to dělat to zvláště vhodný pro přenos dat být:
- slučitelnost s webem a protokoly internetu
- současně člověk - a stroj-čitelný formát
- podpora pro Unikód reprezentovat celý proud a mnoho historických znakových sad
- schopnost reprezentovat nejobecnější informatika datové struktury (záznamy, se nakloní a treess)
- formát je self-dokumentovat v tom to popisuje strukturu a jména pole stejně jako specifické hodnoty
- přísná syntax dělá nutný rozebrat algoritmy rychlý a účinný.
- robustní, logicky-ověřitelný formát založený na mezinárodních úrovních
- hierarchická struktura vhodný pro nejvíce (ale ne všichni) druhy dokumentu
- soubory holého textu, unencumbered licencemi nebo omezení
- platforma-nezávislý, tak relativně imunní proti změnám v technice
- už byl v použití (jako SGML) na dlouho přes dekádu, tak tam je rozsáhlé zkušenosti a dostupný software.
- je ne stlačený
- stále potřebuje dále rozebrat získat individuální hodnoty.
- modelovat překrývání (non-hierarchický) datové struktury vyžaduje zvláštní snahu.
XML dokument je text, obvykle Unikód ačkoli jiné encodings mohou být používány.
Unlike, například, HTML, XML je velmi závislý na struktuře, obsahu a integritě pro jeho účinnost. V objednávce dokumentu být zvažován “dobře-se tvořil” [1], to musí přizpůsobit se (u velmi nejméně) ke sledování:
- To musí mít jednoho (a jediný) kořenový element.
- Non-prázdné elementy musí být ohraničeny začátkem-přívěsek a konec-přívěsek. Prázdné elementy mohou být označené s se vyprázdnit-přívěsek elementu.
- Všechny hodnoty atributu musí být citován.
- Značky mohou být vložené ale smět ne překrývání, to je každý non-kořenový element musí být kompletně obsažený v dalším prvku.
Také, znovu unlike HTML, chytrá volba XML elementových jmén dovolí význam dat být udržen jako součást značení. Toto dělá to více snadno tlumočilo softwarovými programy.
Jako konkrétní příklad, jednoduchý recept vyjádřený v XML reprezentaci by mohl být: