什么是DTD(文档类型定义)?
一个DTD可以看做是标记语言的语法文件,它是一套定义XML标记如何使用的规则。DTD定义了元素、元素的属性和取值,以及哪个元素可以被包含在另一个元素中的说明。DTD还可以用于定义实体。
请看一看下面的例子,它是一个关于email的DTD:
<!ELEMENT Mail (From, To, Cc?, Date?, Subject, Body)>
<!ELEMENT From (#PCDATA) >
<!ELEMENT To (#PCDATA) >
<!ELEMENT Cc (#PCDATA) >
<!ELEMENT Date (#PCDATA) >
<!ELEMENT Subject (#PCDATA) >
<!ELEMENT Body (#PCDATA | P | Br)* >
<!ELEMENT P (#PCDATA | Br)* >
<!ATTLIST P align (left | right | justify) "left" >
<!ELEMENT Br EMPTY >
根据上面这个DTD的内容,与之符合的XML文档具备如下特征:
l 有一个From、一个To、一个可选择的Cc、一个可选择的Date、一个Subject和一个body。
l From 、To、Cc、Date、Subject元素只包含文本信息。
l Body元素可以含有文本和零或者多个P和Br元素。
l P元素可以包含文本和零或者多个Br元素。
l P元素有一个align属性,它的可取值范围是left、justify 或者right,默认值是left。
l Br元素是空的。
XML解析器将使用这个DTD来解析XML文档。DTD使我们能够发布文档以供其他人共享。XML文档应该具备告诉XML执行程序寻找DTD的指令,XML文件开头的<!DOCTYPE> 元素就执行了这个寻找功能。请看下面的例子:
<!DOCTYPE Mail system "http://infowest.com/DTDS/mail.dtd">
<Mail>
..
..
..
</Mail>
有效XML文档以及简化格式的XML文档
XML文档分为两类:有效的XML文档以及简化格式的XML文档。
一个简化格式的XML文档必须遵从下面几个原则:
l 至少有一个元素
l 遵守XML规范
l 根元素(比如上面例子中的<Mail>)应该不被其他元素所包含
l 适当的元素嵌套是必须的
l 属性值应该在问号内
l 除了保留实体外,所有的实体都要声明
XML文档举例
例子1 - 一个简化格式的XML文档:
<?xml version="1.0" standalone="no"?>
<Mail>
<From>Author</From>
<To>Receiver</To>
<Date> Thu, 7 Oct 1999 11:15:16 -0600</Date>
<Subject>XML Introduction</Subject>
<body><p>Thanks for reading<Br/>
this article</p>
<br/>
<p>Hope you enjoyed this article</p>
</body>
</Mail>
第1行是XML声明,其中version属性指明了XML的版本,standalone属性等于"no"表示标记声明不独立于文档内部。XML声明可以看做是"运行指令"。尽管这个声明不是必须的,但是最好包含它,这将提高文档的灵活性。
例子2 - 一个遵守mail.dtd文件的有效XML文档。Date元素被省略,因为在mail.dtd中它是可选的。 元素 P 具有justify属性。Body和P元素间是Comments文本:
<?xml version="1.0" standalone="no"?>
<!DOCTYPE Mail system "http://infowest.com/DTDS/mail.dtd">
<Mail>
<From>Author</From>
<To>Receiver</To>
<Cc>Receiver2</Cc>
<Subject>XML Introduction</Subject>
<body>Comments:<p align="justify">Thanks for reading<Br/>
this article</p>
<br/>
<p>Hope you enjoyed this article</p>
</body>
</Mail>
例子3 -一个遵守mail.dtd文件的有效XML文档,存在Date 元素和Cc 元素,P元素拥有属性right:
<?xml version="1.0" standalone="no"?>
<!DOCTYPE Mail system "http://infowest.com/DTDS/mail.dtd">
<Mail>
<From>Author</From>
<To>Receiver</To>
<Cc>Receiver2</Cc>
<Date> Thu, 7 Oct 1999 11:15:16 -0600</Date>
<Subject>XML Introduction</Subject>
<body>Comments:<p align = "right" >Thanks for reading<Br/>
this article</p>
<br/>
<p>Hope you enjoyed this article</p>
</body>
</Mail>
XML 文档可以含有注释信息,注释的语法与HTML相似。除了"--"字符串外,任何文本信息都可以放置在标记<-- 和 -->之间。处理指令PI(Processing instruction)可以嵌入到文档中, PI的数据成分可以被处理进程所识别。
创作者也许希望包含一些不被解析器解析的代码。这些代码可以放置到忽略代码段中。可忽略的代码段具备如下的语法:
<[CDATA[被忽略的文字信息]]>
简言之,忽略代码段要以<[CDATA[ and end with ]]> 开始。
XML编辑器
XML 编辑器提供给用户创建自定义标记的一个环境。其中最流行的一个是XML<PRO> ,它可以从这里下载得到 http://www.vervet.com/。XML<PRO>具备如下特征:
l 文档验证:XML<PRO> 可用于检验文档的有效性
l 实体模板:提供了一个用于插入定义实体的悬浮模板
l 可以将DTD 与文档进行关联
如果想了解XML编辑器的更多信息及最近进展情况,请访问:http://www.XML.com/pub/Guide/XML_Editors