为什么要使用XML

XML代表扩展标记语言(Extensible Markup Language),是由World Wide Web ConsortiumW 3C )的XML工作组定义的。这个工作组是这样描述该语言的:“扩展标记语言(XML)是SGML的子集,其目标是允许普通的SGMLWeb上以目前HTML的方式被服务、接收和处理。XML被设计成易于实现,且可在SGMLHTML之间互相操作。”

 

    “关于此规范的正确题目,亦即XML的正确全名,应该是Extensible Markup Language eXtensible Markup Language只不过是一个拼写错误罢了。但是,现在简写XML不仅正确,而且正如它在本规范的标题中一样,是Extensible Markup Language的官方名称。

 

    这个名称和简写是由James Clark最先提出的,其它可供选择的名称还包括小型标准置标语言MGML (Minimal Generalized Markup Language), 标准标记语言的小型结构MAGMA (Minimal Architecture For Generalized Markup Applications), 以及互联网标记结构语言SLIM (Structured Language for Internet Markup)

 

    ——Extensible Markup Language (XML) 1.0 Specs, The Annotated Version.

 

    正如所看到的,XML是一种专门在World Wide Web上传递信息的语言,就像HTML(超文本标记语言)一样(自从Web出现以来,HTML已经成为了创建Web页的标准语言)。因为我们已经有了HTML,而且它已发展成一种似乎可以满足任何需要的语言,所以,你可能会疑惑:为什么我们还需要在Web上采用一种全新的语言呢? XML有什么新特性和不同之处?它有什么特有的优点和长处呢?它与HTML有什么关系?它是要替换还是增强HTML?最后,这个以XML作为其子集的SGML是什么,为什么我们不就用SGML来创建Web页呢?

    HTML提供了固定的预定义元素集,可以使用它来标记一个典型、通用的Web页的各个组成部分。预定义元素的例子有:标题(heading)、图片(paragraph)、列表(list)、表格table、图像(image)和链接(link)。显示HTML页的浏览器可以识别这些标准元素中的每一个元素,并且知道怎样格式化和显示它们。例如,浏览器通常用最大的字体显示H1标题, H2标题用一个较小的字体,元素P表示更小的字体。它在未排序的列表中把一个LI元素显示成一个带有项目符号的、缩进的段落。

    尽管自从第一个HTML版本后,预定义的HTML元素已经得到了极大的扩展,但是HTML仍然无法适用于已定义的众多文档类型。下面就是无法使用HTML充分描述的文档示例:

l         不是由典型的组成部分(标题、段落、列表、表格等等)组成的文档。例如,HTML缺乏标记音乐乐谱或算术等式集的元素。

l         想要组成树型分层结构的文档。例如,你正在写一本书,而且想要把它分为部分、章、A小节、B小节、C小节等等。接着,一个程序可以使用这个结构化的文档生成目录,各种不同级别细节信息的架构,抽取特定的小节,以及通过其他方法使用这些信息。

 

    另外,还更有一批对HTML无可奈何的人,那就是搜索引擎的开发者。因为从HTML的标签本身,他们几乎得不到任何有用的信息。如果你要到网上去找出世界上所有关于XML的书籍的价钱,天啊,搜索引擎要被你忙坏了。它要分辨网络上哪些“XML”字段对应的是书名,又要知道这些书名所对应的价钱。可能你会说,在我们图书馆的网页中,这不是已经办到了吗?问题就在这里,图书馆是根据内部的数据库来进行搜寻的,数据库中的各个字段都有着明确的含义。但搜索引擎在网上是根据HTML文件来进行搜索的,那些原本条理清晰、层次分明的数据库的内容在HTML文件中早就被各种各样的标签搞得混乱不堪,而搜索引擎则不得不在这些混乱的内容中大海捞针!

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值