Характеристика и возможности расширяемого языка разметки XML.
Язык описания схемы данных XML (DTD).
XML (англ. eXtensible Markup Language —
расширяемый язык разметки; произносится [экс-эм-э́л]) — рекомендованный
Консорциумом Всемирной паутины язык разметки, фактически представляющий собой
свод общих синтаксических правил. XML — текстовый формат, предназначенный для
хранения структурированных данных (взамен существующих файлов баз данных), для
обмена информацией между программами, а также для создания на его основе более
специализированных языков разметки (например, XHTML). XML является упрощённым
подмножеством языка SGML.
Правильно построенные и действительные документы XML
Стандартом
определены два уровня правильности документа XML:
- Правильно построенный (англ. well-formed). Правильно построенный документ соответствует всем общим правилам синтаксиса XML, применимым к любому XML-документу. И если, например, начальный тег не имеет соответствующего ему конечного тега, то это неправильно построенный документ XML. Документ, который неправильно построен, не может считаться документом XML; XML-процессор (парсер) не должен обрабатывать его обычным образом и обязан классифицировать ситуацию как фатальная ошибка.
- Действительный (англ. valid). Действительный документ дополнительно соответствует некоторым семантическим правилам. Это более строгая дополнительная проверка корректности документа на соответствие заранее определённым, но уже внешним правилам, в целях минимизации количества ошибок, например, структуры и состава данного, конкретного документа или семейства документов. Эти правила могут быть разработаны как самим пользователем, так и сторонними разработчиками, например, разработчиками словарей или стандартов обмена данными. Обычно такие правила хранятся в специальных файлах — схемах, где самым подробным образом описана структура документа, все допустимые названия элементов, атрибутов и многое другое. И если документ, например, содержит не определённое заранее в схемах название элемента, то XML-документ считается недействительным; проверяющий XML-процессор (валидатор) при проверке на соответствие правилам и схемам обязан (по выбору пользователя) сообщить об ошибке.
Язык описания схемы данных XML (DTD)
В XML- документах DTD определяет набор
действительных элементов, идентифицирует элементы, которые могут находиться в
других элементах, и определяет действительные атрибуты для каждого из них.
Синтаксис DTD весьма своеобразен и от автора-разработчика требуются
дополнительные усилия при создании таких документов(сложность DTD является
одной из причин того, что использование SGML, требующего определение DTD для
любого документа, не получило столь широкого распространения как, например,
HTML). Как уже отмечалось, в XML использовать DTD не обязательно - документы,
созданные без этих правил, будут правильно обрабатываться
программой-анализатором, если они удовлетворяют основным требованиям синтаксиса
XML. Однако контроль за типами элементов и корректностью отношений между ними в
этом случае будет полностью возлагаться на автора документа. До тех пор, пока
грамматика нашего нового языка не описана, его сможем использовать только мы, и
для этого мы будем вынуждены применять специально разработанное программное
обеспечение, а не универсальные программы-анализаторы..
Для того, чтобы использовать DTD в нашем документе,
мы можем или описать его во внешнем файле и при описании DTD просто указать
ссылку на этот файл или же непосредственно внутри самого документа выделить область,
в которой определить нужные правила.