Hot linka, zatelefonujte nám 774 731 550

SLOVNÍK - XML - rozšiřitelný značkovací jazyk

XML - eXtensible Markup Language (rozšiřitelný značkovací jazyk)
je obecný značkovací jazyk, který byl vyvinut a standardizován konsorciem W3C. V podstatě je to základní stavební jazyk všeh moderních internetových formátů. Jazyk je určen především pro výměnu dat mezi aplikacemi a pro publikování dokumentů - ovšem není to nijak striktně omezeno. Nezabývá se sám o sobě vzhledem dokumentu nebo jeho částí ovšem je možné jej použít téměř na cokoliv. Jazyk XML nemá žádné předdefinované značky (tagy, názvy jednotlivých elementů). Aktuální verze XML je 1.1.

Při používání XML dokumentu potřebujeme také dokument zobrazit. XML samo o sobě žádné prostředky pro definici vzhledu nenabízí. Existuje ale několik stylových jazyků, které umožňují definovat, jak se mají jednotlivé elementy zobrazit. Souboru pravidel nebo příkazů, které definují, jak se dokument převede do jiného formátu, se říká styl.

Jeden vytvořený styl můžeme aplikovat na mnoho dokumentů stejného typu, stejně tak můžeme na jeden dokument aplikovat několik různých stylů. Výsledkem může být např. PostScriptový soubor, HTML kód nebo XML s obsahem původního dokumentu.

Stylových jazyků existuje dnes několik. Mezi nejznámější patří asi kaskádové styly - CSS. Ty lze použít pouze pro jednoduché formátování, které dobře poslouží pro zobrazení dokumentu na obrazovce. Další možností je rodina jazyků XSL (eXtensible Stylesheet Language). Ta umožňuje dokument různě upravovat a transformovat – vybírat části dokumentu nebo generovat obsahy a rejstříky.

Automatická kontrola struktury dokumentu

XML neobsahuje předdefinované značky (tagy), je třeba definovat vlastní značky, které budeme používat. Tyto značky je možné (nepovinně) definovat v souboru DTD (Document Type Definition) nebo alternativou XSD (XML Schema Definition) . Potom je možné automaticky kontrolovat, zda vytvářený XML dokument odpovídá této definici. Program, který tyto kontroly provádí, se nazývá parser. Při vývoji aplikací můžeme parser použít, a ten za nás detekuje většinu chyb v datech.

DTD není jediný definiční jazyk pro XML. Neobsahuje možnost kontrolovat typy dat (čísla, měnové údaje, údaje o datu a čase). To je vlastnost, která chybí při zpracování dat databázového charakteru. V současné době se pod názvem XML schémata pracuje na půdě konsorcia W3C na vytvoření jednotného standardu, který tyto kontroly umožní.

Pro různé standardní aplikace byla postupně vytvořena schémata, která definují značky (názvy elementů) pro konkrétní typy dokumentů. Příkladem může být DocBook, který definuje struktury pro vytváření knih, článků, vědeckých publikací a podobně. Výhodou takových aplikací je, že současně s definičními soubory DTD je dodávána sada stylů (XSL souborů) pro následné zpracování a přípravu pro tisk, nebo pro převod do jiných standardních tvarů (PostScript, HTML atd.).

Další vlastností XML je, že v jednom dokumentu můžeme používat najednou nezávisle na sobě několik druhů značkovaní pomocí jmenných prostorů (namespaces). To umožňuje kombinovat v jednom dokumentů několik různých definic ve formě DTD nebo schémat bez konfliktů v pojmenování elementů.

Syntaxe XML

XML dokument je text a vždy Unicode, v Česku obvykle kódovaný jako UTF-8, ale jsou přípustná i jiná kódování.

Na rozdíl od např. HTML, efektivita XML je silně závislá na struktuře, obsahu a integritě. Aby byl dokument považován za správně strukturovaný , musí mít nejméně následující vlastnosti:

  • Musí mít právě jeden kořenový (root) element.
  • Neprázdné elementy musí být ohraničeny startovací a ukončovací značkou. Prázdné elementy mohou být označeny tagem „prázdný element“.
  • Všechny hodnoty atributů musí být uzavřeny v uvozovkách – jednoduchých (') nebo dvojitých ("), ale jednoduchá uvozovka musí být uzavřena jednoduchou a dvojitá dvojitou. Opačný pár uvozovek může být použit uvnitř hodnot.
  • Elementy mohou být vnořeny, ale nemohou se překrývat; to znamená, že každý (ne kořenový) element musí být celý obsažen v jiném elementu.
  • XML je CASE-SENSITIVE. Jména elementů v XML rozlišují malá a velká písmena: např. „<Odpoved>“ a „</Odpoved>“ je pár, který vyhovuje správně strukturovanému dokumentu, pár „<odpoved>“ a „</Odpoved>“ je chybný.

Ukázka základního kódu XML:
 <?xml version="1.0" encoding="UTF-8" ?> 
<Odpoved>
  <ico>12275107</ico> 
   <jmeno>JAN NOVÁK</jmeno> 
    <vek>18</vek> 
     <povolani>Podnikatel</povolani> 
      <klic>178432<klic>  
        <Pocet_zaznamu>1</Pocet_zaznamu> 
</Odpoved>
 

Zpracování XML

Existují dva nejčastější přístupy ke zpracování XML dokumentu:

  • DOM parser (DOM = Document Object Model) vezme XML dokument a vyrobí z něho obraz (strom) v paměti.
  • SAX parser (SAX = Simple API for XML) postupně prochází XML dokument a vyvolává události. Je na programátorovi, aby tyto události zpracoval.

Aplikace XML

Využití jazyka XML pro další formáty :

  • XHTML – vznikl kombinací HTML a XML
  • RDF– Resource Description Framework, specifikace, která umožňuje popsat metadata, např. obsah a anotace HTML stránky.
  • RSS – je rodina XML formátů, sloužící pro čtení novinek na webových stránkách
  • SMIL – Synchronized Multimedia Integration Language, popisuje multimedia pomocí XML.
  • MathML – Mathematical Markup Language je značkovací jazyk pro popis matematických vzorců a symbolů pro použití na webu.
  • SVG – Scalable Vector Graphics je jazyk pro popis dvourozměrné vektorové grafiky, statické i dynamické (animace).
  • DocBook – Sada definic dokumentů a stylů pro publikační činnost
  • Jabber – Protokol pro Instant messaging
  • SOAP – Protokol pro komunikaci mezi Webovými službami
  • Office Open XML, OpenDocument – Souborový formát určený pro ukládání a výměnu dokumentů vytvořených kancelářskými aplikacemi
  • XSLT - slouží k převodům zdrojových dat ve formátu XML do libovolného jiného požadovaného formátu, nejčastěji HTML, jiného XML nebo libovolných jiných datových struktur.
  • XSL - je rodina jazyků umožňujících popsat jak se mají XML soubory formátovat a převádět.
  • AJAX - využití xml jako součást technologie pro výměnu dat bez obnovení www stránky


Výhody XML (z hlediska zdroje a funkce přenosu informací)

  • Jednoduchost a přehlednost. Pokud se nejedná o binární XML (nečitelné člověkem)
  • Dá se stylovat a upravovat
  • Generování šablonami

Nevýhody XML (z hlediska zdroje a funkce přenosu informací)

  • Při větším množství dat obrovská rozsáhlost kódu
  • Stále je to jen mezičlánek a proto prodlužuje čas získávání informací


Zpět

Slovníček - výběr pojmu:

Vyberte ze seznamu výraz, který Vás zajímá.

Copyright © Stargen 2000-2014 TOPlist