23.5.07

Laické zamyšlení o genialitě XML

Nejsem odborník, tak mě klidně opravte.. ale snad jsem princip pochopila:)

Tak jsem dnes přemýšlela, o kolik informací svět přichází jen tím, že je nenajde? Co když je to ztráta fatální? Nepokračoval by snad vývoj všech odvětví mnohem rychleji jen díky tomu, že by neexistovaly informační bariéry?

Některé informace jsou nedostupné ze zcela prozaických důvodů – tajemství nebo utajení, zdrojové kódy softwaru jako předmět autorského zákona a tak. Potom jsou tu ale informace obecně přístupné – to ale není synonymem slova dostupné.

Internet sice může obsahovat „nekonečné“ množství informací, moje babička je tam ale nikdy nenajde, protože neovládá počítač – médium, které nám internet zpřístupňuje. U mojí babičky jde o bariéru v podstatě nepřekonatelnou, protože ve svých sedmdesáti letech už se počítač ovládat naučí jen stěží.

Zkusím se zaměřit na bariéry, které jsou překonatelné.

Představuji si internetový vyhledávač, do jehož políčka zadám „zverimex Praha 8“. Ideálně bych doufala, že mi vyhledávač dodá všechny zverimexy v městské části Praha 8. Realita je taková, že první tři výstupy hledání jsou sice zverimexy, dva z nich dokonce i pražské, ani jeden ovšem není na Praze 8. Ano, možná jsem dotaz dostatečně přesně nespecifikovala, ale kdo z běžných uživatelů by byl přesnější?

Internetová realita je taková, že se k tvorbě webových stránek používá vcelku jednoduchý jazyk HTML (Hypertext Markup Language). Ten ale jen říká, jaké mají části textu parametry, v podstatě jim udává vzhled a funkci, definuje zobrazení. Nepostihuje tedy jejich podstatu. Tím nám ale znemožňuje efektivní vyhledávání a výměnu dat; svými předdefinovanými tagy je vlastně omezený.

V současnosti se upřednostňuje právě srozumitelnost zdrojového kódu (zejména pro technické zpracování, ne tak pro člověka) a zřejmost pro vyhledávače. Podívejte se na tenhle příklad běžného formátování zdrojového HTML kódu, kde vidíte strukturu dpovídající vzhledu textu:

Abychom zásadně umožnili zpracování dokumentu vyhledávači, musíme ale oddělit formu sdělení od obsahu, což zlepší strukturu textu. Představte si to takhle:

Ve skutečnosti je druhá struktura tvořená předdefinovanými VLASTNÍMI značkami. Ty v jazyku HTML neexistují, vypůjčili jsme si je z takzvaných SAMOPOPISNÝCH značkovacích jazyků, které umí OZNAČIT VÝZNAM jednotlivých částí textu, nikoliv jen jejich vzhled. Ten samozřejmě můžeme také variabilně měnit.

Právě jedním z fenoménů, který se začíná objevovat a používat nejen v oblasti internetu, ale i v elektronických databázích, je XML neboli eXtensible Markup Language. Jak jsem zmínila, XML umí označit nikoliv vzhled textu, ale i jeho význam. Pomáhá nám tak například rozlišovat, co je v textu titulek, co popiska obrázku, co jsou použité prameny. Podle mnohých odborníků je právě XML možností, jak skutečně dovést internet a web do třetího tisíciletí. Já s tím v podstatě souhlasím, protože už teď jsem se zamilovala do možností, které bude umožňovat budoucí svět snadného vyhledávání informací.

Pro názornost vám uvádím ještě jeden příklad. Pořádně si to přečtěte.

Už chápete v čem spočívá genialita užívání XML?

V budoucnosti by se zpracování webů ve formátu XML mohlo (a mělo) stát samozřejmostí, realizace se ale neobejde bez zapojení všech uživatelů a řadových tvůrců.

Chcete vědět víc?

http://www.kosek.cz/clanky/swn-xml/uvod.html

http://www.oreillynet.com/pub/a/oreilly/tim/news/2005/09/30/what-is-web-20.html

http://cs.wikipedia.org/wiki/XML


Příspěvek KRISTÝNY GREPLOVÉ.

No comments: