————来自(《计算机是怎样跑起来的》读书笔记)
问题引入:
1.HTML与XML的区别:
HTML 是用于编写网页的标记语言。XML 是用于定
义任意标记语言的元语言。
通常把用于定义新语言的语言称作元语言。通过使用 XML 可以定义出各种各样的新语言。
2. 在处理 XML 文档的程序组件中,哪个成为了 W3C 的推荐标准?
DOM(Document Object Model,文档对象模型)。
3. 所谓标记语言,就是可以用标签为数据赋予意义的 语言。
XML概念
XML——Extensible Markup Language(可扩展标记语言)。
- 标记语言:
例如:用于编写网页的 HTML(Hypertext Markup Language,超文本标记语言)就是一种标记语言。
注:(html的小知识)
按F2就会自动打开浏览器所附带的“原始源”窗口,上面显示的正是 index.html 的内容(如图 11.2 所示)。可以看到里面有很多用“<”和 “>”括起来的单词,例如
<html>、<head>、<title>、<body>
等。通常把 它们称作“标签”。<html>
是用于表示这是 HTML 文件的标签。同样, 其他标签也分别被赋予了意义,<head>
表示网页的头部,<title>
表示网 页的标题,<body>
表示网页的主体。除此之外还有很多标签,例如使文 字加粗显示的<b>
、在网页中插入图片的<img>
,等等
因此:通常把通过添加标签为数据赋予意义的行为称为“标记”。为这种 给数据赋予意义的行为定义规则的语言就是“标记语言”。
或者说可使用的标签的种类决定了标记语言的规范。
-
扩展:
因此XML是标记语言,也可扩展的,扩展名是.xml
,与HTML不同的是XML本身不会去限制标签的种类,因此<,>内的单词是自定的。
故:HTML是固定的标记语言。
XML是可扩展的标记语言。 -
XML是元语言。
XML 并没有限定标签的使用方式,使用什么样的标签都可以。可以说 XML 仅仅限定了进行标记时标签的书写格式(书写风格)。也就是说通过定义要使用的标签种类,就可以创造出一门新的标记语言。 通常把这种用于创造语言的语言称作“元语言”。
XML中主要约束:
注:XML数据是纯文本形式,因此可以用记事本等文本编辑器编写XML文件。
XML用途
- 由XML的发展过程可知:
HTML的发展仅限于浏览器可视化的发展,但对于网页内的数据处理十分麻烦,必须在HTML源代码里提出原有标签以及对应数值,
如果可以直接定义自己想要的标签,然后运行提炼需要的操作则XML这种元语言应运而生。
此后HTML就专门负责信息的可视化了,有了更加灵活的XML语言为在互联网上交换的信息赋予意义。
一语以敝之,则是: HTML 是给人看的,XML 是给计算机看的 - XML登上舞台后也需要标准制约,——W3C(World Wide Web Consortium, 万维网联盟)的机构,该机构以“W3C 推荐标准”的形式制定了一系 列标准。XML 于 1996 年成为了 W3C 的推荐标准(XML 1.0)
图解如下:
XML是通用的数据交换形式——对比CSV和XML
W3C 的推荐标准是不依赖于特定厂商的通用规范。在计算机行业,长久以来一直把 CSV(Comma Separated Value, 逗号分隔值)作为通用数据交换格式沿用至今。故下面就试着对比一下 XML 和 CSV:
CSV | XML | |
---|---|---|
相同点 | 都是由字符构成的纯文本文件 | 都是由字符构成的纯文本文件 |
相异点 | 1、扩展名:.csv , 2、记录的是 经过“,”(半角逗号)分割后的信息, 3、只记录信息本身 | 1、扩展名:.xml , 2、记录的是“<”,">"里面的信息 , 3、为各个信息赋予意义, 4、但自身的文件尺寸更大,占用过多存储 |
XML特点
- 可以为XML的标签设定命名空间——W3C推荐标准
所谓命名空间,通常是 一个能代表企业或个人的字符串,用于修饰限定标签的名字。在 XML 文档中,通过把“xmlns=" 命名空间的名字 "”作为标签的一个属性记 述,就可以为标签设定命名空间。xmlns 即 XML NameSpace(命名空 间)的缩写。通常用全世界唯一的标识符作为命名空间的名称。
- 严格定义XML的文档结构
完整的 XML 文档包括 XML 声明、 XML 实例和 DTD 三个部分。所谓 XML 声明,就是写在 XML 文档开 头的、形如 <?xml version="1.0" encoding="Shift_JIS"?> 的部分。XML 实例是文档中通过标签被标记的部分。而 DTD 的作用是定义 XML 实 例的结构。虽然也可以省略 DTD,但是通过 DTD 可以严格地检查 XML 实例的内容是否有效。
- XML用于的领域