Введение в HTML

-=оглавление=- next=>

В. Лебедев (swans@mail.ru)

Язык разметки

Необходимость четкого определения тех или иных элементов текста, вне зависимости от текущего оформления документа, послужила, в свое время причиной создания языков разметки текста. Анализируя текст, мы вычленяем в нем название всего документа, названия отдельных частей документа, разбиение текста на абзацы, вычленяем главные и второстепенные мысли, то есть, отмечаем для себя те или иные структурные элементы текста. Языки разметки призваны формализовать (то есть, в данном случае, унифицировать) структуру текстового документа.

Для обозначения тех или иных структурных документов используются специальные знаки - элементы разметки. Программа, с помощью которой будет просматриваться документ, интерпретирует элементы разметки и, либо своеобразно оформляет размеченные элементы, либо выдает информацию о типе каждого элемента текста.

Таким образом, элементы разметки должны быть "понятны" программе, с помощью которой просматривается текст. Программы для просмотра текста будем называть "браузерами".

Примечание
Текстовые редакторы также используют языки разметки, однако разность данных языков зачастую не позволяет адекватно прочесть документ, созданный одной программой в другой прогреамме.

Пример. Рассмотрим текст, который Вы сейчас читаете.
Очевидно, он начинается с названия. Введем элемент разметки "Название документа". Далее следует подзаголовок "Содержание", вглядываясь в текст, мы можем обнаружить еще несколько заголовков того же уровня "Введение", "Структура HTML документа", назовем их "Заголовок 2 уровня" (заголовком 1 уровня, очевидно, является название документа).
Теперь, чтобы не спутать элементы разметки с самим текстом, добавим к ним специальные символы, например, в начале открывающую угловую скобку, а в конце закрывающую угловую скобку. И внесем их сам текст:
<Название документа>Учебное пособие по языку разметки HTML
<Заголовок 2 уровня>Содержание

Теперь нам необходим браузер, понимающий данный язык разметки, с помощью которого документ будет адекватно выводиться на экран или принтер.

Одним из наиболее распространенных языков разметки на сегодняшний день является HTML, который фактически стал стандартом языка разметки для создания Internet-документов.

История SGML, HTML, XML

Прародителем HTML является SGML (Standardized Generalized Markup Language, универсальный стандартизованный язык разметки). Хотя SGML был создан еще в начале 60-х, он был утвержден только в 1986 году как международный стандарт. Незначительная популярность SGML обусловлена тем, что этот язык достаточно (сравнительно) сложен.

Для интерпретации текста, размеченного SGML, необходим специальный DTD-файл (Document Type Definition), в котором описаны все элементы разметки языка (в дальнейшем будем называть их тегами).

Однако, существование DTD позволяет автору документа создавать свои уникальные теги. Браузеру необходимо только указывать путь к DTD-файлу, и он становится способен адекватно отображать SGML-документ.

В 1991 году Тимом Бернесом-Ли, был разработан DTD, который был "вмонтирован" в браузер, содержал небольшое количество тегов и предназначался для разметки технической документации. Так появился на свет HTML (Hyper Text Markup Language, язык разметки гипер-текста). Таким образом, HTML, является одной из реализаций SGML (или SGML-приложением).

Примечание
Гипер-текст - это текст, содержащий ссылки к отдельным частям этого текста или к другим текстовым документам. Примерами гипер-текста являются документы со сносками, каталоги, энциклопедии.

Со времени (момента) своего создания HTML постоянно развивался. (Сейчас реализована его 4-я версия.) Однако разработчики последних версий HTML отошли от начальной концепции языка. HTML все больше и больше превращается из языка разметки в язык оформления документа, где не обязательно указывать, каким структурным элементом является тот или иной текст, а достаточно указать, как он должен отображаться на экране. Ко всему набор тегов HTML до сих пор весьма ограничен (и, так как, нет доступа к модификации его DTD - не дополняем).

Эти причины послужили тому, что компания Sun Microsystems осуществила разработку языка XML (Extensible Markup Language, расширяемый язык разметки). XML, также, как и HTML, является SGML-приложением. Однако в отличие от HTML, позволяет создавать собственные DTD (то есть, фактически, собственные теги), не содержит средств для оформления документа, и в отличие от SGML достаточно прост и удобен.

Хотя XML и более перспективный язык для разметки Internet-документов, однако распространенность и простота HTML послужили тому, что мы (пока) рекомендуем именно его для разработки страничек и сайтов.
-=оглавление=- next=>