详解XML中的模式Schema

(编辑:jimmy 日期: 2024/12/25 浏览:2)

文档定义模型为XML文档提供了规范,DTD的引入虽然解决了XML文档的规范化问题,但它文件格式类型和XML文件格式类型不一致,同时DTD提供的数据类型有限有时候无法满足行业的需求,所以引入了Schema。Schema模式可以确定XML文档的元素和属性的结构、元素的顺序、元素和属性的数据值,根据范围、枚举以及样式匹配等。
详解XML中的模式Schema

一、Schema初识

XML Schema语言也被称为XML Schema Definition (XSD),它的作用是定义一份XML文档的合法组件群(XML文档的结构),就像DTD的作用一样。 XML Schema以XML语言作为基础,也可以说XML Schema自身就是XML的一种应用。

1、Schema作用

XML Schema和DTD的作用一样,都是用来定义一个XML文档的结构的模式,那么为什么有了DTD还要有XML Schema呢? 因为,XML Schema比DTD作用更加强大。

Xml Schema 比 DTD的优越性:
(1)模式是可扩展的
(2)模式比 DTD 功能更丰富且更有用
(3)模式是用 XML 编写的
(4)模式支持数据类型
(5)模式支持名称空间
(6)不需要在学习其他的语言
(7)可以直接使用XML编辑器来编写XML Schema
(8)可以直接使用XML解析器来解析XML Schema
(9)可以使用XML DOM来灵活的操作XML Schema
(10)可以使用XSLT技术来转换XML Schema

2、对比学习

1.1 作用上

两者相同,都是定义了一个XML文档的结构的模式。

1.2 用法上

两者作用相同,但是语法上有些区别。Schema是DTD的扩展,同样支持元素和属性的定义,并且定义的语法相似,但Schema可以给元素和属性添加相应的数据类型,同时还引入了全局和局部元素声明的语法,另外根据元素和属性的数据内容引入了简单类型和复杂类型。
所谓的简单类型(SimpleType)和复杂类型(ComplexType),它们本身并不是具体的数据类型,它们只是对节点或者自定义类型的类型作一个抽象的说明。

也就是说Schema的引入使得模式的声明更加类似于我们使用的编程语言。

二、实例详解

2.1 Schema实例

清单1:User.xml文档结构

XML/HTML Code复制内容到剪贴板
  1. <?xml version="1.0"?>     
  2. <用户列表>     
  3.     <用户>     
  4.          <用户名>xx</用户名>     
  5.          <密码>123456</密码>     
  6.          <用户类型>1</用户类型>     
  7.    </用户>     
  8. </用户列表>    

清单2:使用全局组件形式来定义Schema,User.xsd

XML/HTML Code复制内容到剪贴板
  1. <!-- 使用全局组件形式定义 -->     
  2. <?xml version='1.0' encoding='utf-8'?>     
  3. <xs:schema xmlns:xs='http://www.w3.org/2001/XMLSchema' elementFormDefault='qualified' attributeFormDefualt='unqualified'>     
  4.  <xs:element name='用户列表' type='userlist'/>     
  5.  <xs:complexType name='userlist'><!-- 使用complexType声明该类型为复合类型的元素 -->     
  6.   <xs:sequence><!-- 使用sequence说明下面的元素必须按顺序在XML文档中显示 -->     
  7.    <xs:element name='用户' type='user'/>     
  8.   </xs:sequence>     
  9.  </xs:complexType>     
  10.  <xs:complexType name='user'>     
  11.   <xs:sequence>     
  12.    <xs:element name='用户名' type='user'/>     
  13.    <xs:element name='密码' type='user'/>     
  14.    <xs:element name='用户类型' type='user'/>     
  15.   </xs:sequence>     
  16.  </xs:complexType>     
  17. </xs:schema>    

清单3:使用局部形式定义Schema,User.xsd

XML/HTML Code复制内容到剪贴板
  1. <!-- 使用局部形式定义 -->     
  2. <?xml version='1.0' encoding='utf-8'?>     
  3. <xs:schema xmlns:xs='http://www.nishishui.org/2000/XML Schema' elementFormDefault='qualified' attributeFormDefualt='unqualified'>     
  4.  <xs:element name='用户列表'>     
  5.   <xs:complexType>     
  6.    <xs:sequence>     
  7.     <xs:element name='用户'>     
  8.      <xs:complexType>     
  9.       <xs:sequence>     
  10.        <xs:element name='用户名' type='xs:string'/>     
  11.        <xs:element name='密码' type='xs:string'/>     
  12.        <xs:element name='用户类型' type='xs:integer'/>     
  13.       </xs:sequence>     
  14.      </xs:complexType>     
  15.     </xs:element>     
  16.    </xs:sequence>     
  17.   </xs:complexType>     
  18.  </xs:element>     
  19. </xs:schema>    

清单2和清单3的都定义了User.xsd,它们的作用是相同的,都是为了验证XML文档的合法性,但定义的方法不同,清单2是使用全局组件的形式定义,而清单3使用的局部形式定义,具体的区别请看下文。


2.2 基本用法

上文中我们分别从作用和用法上对Schema和DTD进行了对比分析,Schema和DTD最大的区别在于Schema引入了数据类型,其它的如元素和属性的声明等类似于DTD,在下面讨论时就不再详述。

Schema基本内容导图:
详解XML中的模式Schema

2.2.1 引用语法
当一个模式文件建立好以后,可以用它来验证某一个XML文档的有效性,也就是说检验某个XML文档是否遵循了模式文件的定义。 那么,XML文档怎么来引用一个模式文档呢?
Schema模型的引用更类似于前面所说的命名空间的应用方法,具体实例如下:

XML/HTML Code复制内容到剪贴板
  1. <?xml version='1.0' encoding='utf-8'?>     
  2. <用户列表 xmlns:xsi=http://www.nishishui.org/2000/XMLSchema xsi:noNamespaceSchemaLocation='user.xsd'><!-- 引用user.xsd -->     
  3.  <用户>     
  4.   <用户名>我是谁</用户名>     
  5.   <密码>123456</密码>     
  6.   <用户类型>1</用户类型>     
  7.  </用户>     
  8. </用户列表>    

2.2.2 元素类型
(1)按照内容的不同分为简单和复杂元素,分别使用simpleType和complexType标示。
简单元素:元素中内容只能是文本,不包含其它的元素和属性。

XML/HTML Code复制内容到剪贴板
  1. <?xml version='1.0' encoding='utf-8'?>     
  2. <xs:schema xmlns:xs='http://www.nishishui.org/2000/XML Schema' elementFormDefault='qualified' attributeFormDefualt='unqualified'>     
  3.     <xs:element name='age'>     
  4.         <xs:simpleType><!-- 使用关键字simpleType声明简单元素 -->     
  5.             <!--restriction关键字结合minInclusive和maxInclusive控制了XML中元素可接受的值范围为0~100-->     
  6.             <xs:restriction base="xs:integer">     
  7.                 <xs:minInclusive value='0'/>     
  8.                 <xs:maxInclusive value='100'/>     
  9.             </xs:restriction>     
  10.         </xs:simpleType>     
  11.     </xs:element>     
  12. </xs:schema>   

复杂元素:元素中包含其它的元素和属性。它有四种类型,分别是空元素、只包含其他元素、只包含正文、包含正文又包含其他元素。

XML/HTML Code复制内容到剪贴板
  1. <?xml version='1.0' encoding='utf-8'?>     
  2. <xs:schema xmlns:xs='http://www.nishishui.org/2000/XML Schema' elementFormDefault='qualified' attributeFormDefualt='unqualified'>     
  3.     <xs:element name='age'>     
  4.         <xs:complexType><!-- 使用关键字complexType声明复杂元素 -->     
  5.             <!--sequence控制XML内容中元素出现的顺序-->     
  6.             <xs:sequence>     
  7.                 <!-- 定义具体的元素,这些都是简单元素-->     
  8.                 <xs:element name='firstname' type='xs:string'/>     
  9.                 <xs:element name='lastname' type='xs:string'/>     
  10.             </xs:sequence>     
  11.         </xs:complexType>     
  12.     </xs:element>     
  13. </xs:schema>    

(2)按照定义位置可分为局部和全局元素。
全局元素:<element>元素的父元素必须是<schema>;
局部元素:局部元素声明只能出现在复杂类型(<complexType>元素)定义内部。即<element>元素的父元素只能是<all>、<choice>或<sequence>元素。

XML/HTML Code复制内容到剪贴板
  1. <?xml version='1.0' encoding='utf-8'?>     
  2. <xs:schema xmlns:xs='http://www.nishishui.org/2000/XML Schema' elementFormDefault='qualified' attributeFormDefualt='unqualified'>     
  3.     <xs:element name='用户' type='user'/><!-- 全局元素 -->     
  4.     <xs:element name='用户名' type='xs:string'/><!-- 全局元素 -->     
  5.     <xs:element name='密码' type='xs:string'><!-- 全局元素 -->     
  6.         <xs:complexType name='user'>     
  7.             <!--sequence控制XML内容中元素出现的顺序-->     
  8.             <xs:sequence>     
  9.                 <!-- 定义具体的元素,这些都是简单元素-->     
  10.                 <!-- 定义局部元素,使用ref关键字引用,并使用minOccurs和maxOccurs制定元素出现的最少和最多的次数-->     
  11.                 <xs:element ref='用户名' minOccurs='0' maxOccurs='1'/><!-- 局部元素-->     
  12.                 <xs:element ref='密码' minOccurs='0' maxOccurs='1'/><!-- 局部元素-->     
  13.             </xs:sequence>     
  14.         </xs:complexType>     
  15.     </xs:element>     
  16. </xs:schema>