| 建立格式正确的XML文件 |
|
| 来源:网络收集 作者: 加入时间:2006-10-27 访问次数:66 [大 中 小] |
|
XML 文件的最低要求
列表3-1 的XML 文件范例的序文部份包含了所有可以放置在序文中的项目。然而,请注意,这些项目都是选择性的(虽然XML 规格书中指明了你「应该」包含XML 宣告),可有可无。因此,序文本身也是选择性的,而后基本要求的XML 文件,只包含了一个简单的文件元素,符合格式正确的XML 文件标准: A minimalist document. 该文件在Internet Explorer 5 中将显示如下:
 加入元素到文件中
XML 文件中的元素包含了真正的文件信息(例如,在列表3-1 中,有存货清单中书籍的标题、作者、价格,与其它信息),而且指出了这些信息的逻辑结构。 元素会以树状结构的方式被安排,元素可以巢状套迭在其它的元素之中。文件必须明确地拥有一个顶层元素-文件元素或根元素-而其它的元素都套迭在这个元素之下。因此,下面是一个格式正确的XML 文件。
Mark Twain mass market paperback 298 $5.49
Walt Whitman hardcover 462 $7.75
然而,下面的文件则不是格式正确的:
Mark Twain mass market paperback 298 $5.49
Walt Whitman hardcover 462 $7.75
元素必须适当地套迭。这代表,如果元素(由一组起始卷标与结束卷标来界定,作者稍后将会介绍。)是在另一个元素之中开始,它必须也在相同的元素之中结束。例如,这些元素都是格式正确的:
Walt Whitman
然而,这些元素就不是格式正确的:
注意 一个包含一个或多个套迭元素(如列表3-1 中的BOOK)的元素称为父元素(parent element)。而一个直接包含在父元素之下(如BOOK 之下的TITLE)的元素则称为子元素(child element)、副元素(subelement),或父元素的套迭元素。
元素解析
如你所见,元素通常由起始卷标、内容与结束卷标所组成。
 不像HTML,XML 要求你一定要包含起始卷标与结束卷标。(唯一的例外是没有内容的元素,你可以使用稍后介绍的特殊空元素。) 出现在起始卷标与结束卷标开头部份的名称(在上面的例子是TITLE),称为元素的型态(type)或通用识别代号(generic identifier:GI)。型态名称可以用来识别特殊的元素型态或元素类别,而不是特定一个元素。因此,元素可以包含多个拥有相同型态名称的元素(如列表3-1 中的BOOK 或TITLE 元素)。 当你为XML 文件加入元素时,你可以选择任何你想要的型态名称,只要遵守下面的规则即可: 名字必须以字母或底线开头(_),后面接着零或多个字母、数字、句号(.)、连字号(-),或底线(_)。 XML 规格书中说明了元素的型态名称是以「xml」(以任何大写或小写字母组成)为前缀,而且将被保留成为标准规格。虽然Internet Explorer 5 并不强迫要求遵守这项限制,但最好不要使用这个前缀以避免将来产生问题。 下列是合法的元素型态名称: Part _1stPlace A B-SECTION Street.Address.1 下列则是不合法的元素型态名称: 1stPlace B Section B/Section :Chapter A:Section as a namespace ──> 注意 根据XML 规格书中的定义,元素名称中的冒号(:)将被保留作为命名空间(namespace)用。命名空间负责区别拥有相同名称的元素,笔者将在第七章的 <将HTML 元素加到XML 文件中并使用命名空间> 中继续讨论。只有当元素名称接在已经宣告过的命名空间之后,InternetExplorer 5 才会让你在元素名称中加入冒号。例如,A:Section 只有在你已将A 宣告成命名空间时才为合法。 同时,起始标签中的名字必须完全与结束标签中的名字相同,包括字母的大小写。因此,底下的元素就不是格式正确的:
|
|
|
|
|
|