数据库开发(20)XML

1、XML——可扩展标记语言,用来表示数据。当一个应用程序必须与另一个应用程序进行通信或是从一些其他的应用程序中整合信息时,XML作为一种数据格式特别有用。

2、在电子文档处理中,标记语言就是对文档的哪部分是内容、哪部分是标记以及标记含义的形式化描述。

标签是成对使用的,如<title >Database System Concepts </ title>

和HTML不同,XML没有指定的标签集,每个应用可以选择自己需要的标签集。这项特性是XML主要用于数据表示和交换而HTML主要用于文档格式化的关键所在。

3、标签的存在使得消息是自描述的。其次,文档的格式不严格。再次,XML允许嵌套结构。

4、XML数据结构:

XML文档中基本的结构是元素,一个元素就是一对互相匹配的开始和结束标签,以及它们之间出现的所有文本。XML文档中必须有一个独立的根元素来包含文档里的所有其他元素。

如果文本在某元素的开始标签和结束标签之间出现,那么称该文本出现在该元素的上下文中。如果每个开始标签都在同一个父元素的上下文中有唯一的结束标签与之匹配,那么该标签就是正确嵌套的。

5、属性是字符串,不包含标记。属性在给定标签中只可以出现一次,不像子元素那样可以重复。属性是隐式的、不出现在打印或显示文档中的文本。

6、名字空间:

就是在每个标签或属性的前面加上通用资源标识符(比如网址)。一份文档可以有不止一个名字空间,它们声明为根元素的一部分。

7、默认情况下,XML文档可以不需要任何相关模式而被创建。

文档类型定义:DTD是XML文档的一个可选部分。

其主要目的是对文档中出现的信息进行约束和类型限定。每个声明都以一个元素的子元素的正则表达式形式出现。每个元素所允许的属性也在DTD中声明。与子元素不同,属性没有顺序之分。属性必须有一个类型声明和一个默认声明。类型为ID的属性提供该元素的唯一标识符。一个元素最多只有一个属性允许为ID类型。

8、以DTD作为模式机制的局限性:

1)单个文本元素和属性不能进一步限定类型。

2)很难用DTD机制来指定子元素的无序集合。

3)ID和IDREF中缺乏类型限定。

9、XML树模型:

一份XML文档被建模为一棵树,其结点对应于元素和属性。元素的文本内容可以建模为该元素的文本子结点。路径表达式的结果是一个结点的集合。路径表达式是从左到右执行计算的,任意时刻路径的结果由文档中某些结点的一个有序集合构成。

10、XML数据存储:

一种方式是将其以文档形式存储在文件系统中。另一种是构建专用的数据库来存储XML数据。第三种是把XML数据转换为关系表示,并将其存储到关系数据库中。

1)存储为字符串:

小的XML文档可以存储为关系数据库元组中的字符串值。解决方案是把不同类型的元素存储在不同的关系中,并将一些关键元素的值存储为关系的属性以便索引。

2)树表示法:

XML数据中每个元素和属性都被赋予一个唯一标识符。

11、关系数据库中的数据必须被发布(即转换为XML格式)以导出给其他应用。导入的数据必须被分解,即从XML转换回规范化关系形式并存储在关系数据库中。将XML数据分解为关系表示的映射也必须被定义。

12、基于XML的表示现在已被广泛用作存储文档、电子表单数据以及作为办公应用软件包的一部分的包其他数据。XML还用于表示必须在一个应用的不同部分之间进行交换且具有复杂结构的数据。

Web服务使用以XML作为编码参数和结果的机制,提供远程过程调用接口。



  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值