XML语言简介

 

今天老师给我们讲的是XML(标记语言),讲了XML与HTML相比的优点:

HTML语言及其局限性:

HTML(Hyper Text Markup Language,超文本标记语言)是一种用来制作超文本文档的简单标记语言。用HTML编写的超文本文档称为HTML文档,它能独立于各作操作系统平台(如UNIX、Windows等)。自1990年以来,HTML就一直被用作World Wide Web(WWW)上的信息表示语言,用于描述Homepage的格式设计和它与WWW上其他Homepage (Hyperlink)的链接信息。HTML语言是通过利用各种标记(tags)来标识文档的结构及超链接信息的。

HTML之所以能够流行,是因为它有简洁的语法。但也正是由于它过于简洁,也产生了以下几个主要问题:
  (1) 标记扩展复杂。
  HTML当初仅仅提供了一种对静态文本信息表现的方法,但显然并不能适应越来越多的需要。随后越来越多的标签产生了,例如<img>用于描述图片,<script>通过为网页加入脚本支持来提供动态网页内容。日益增多的标记不但使HTML越来越庞大,浏览器的开发越来越复杂,还降低了不同浏览器之间的兼容性。

 (2) 缺乏严格的语法定义。
  HTML文档的正确性很难得到确认。为了使文档的显示过程更加强健,浏览器通常忽略语法分析,不检查语法的正确性。
  (3) 结构化支持差。
  HTML缺乏对复杂结构的支持,例如HTML不能支持分层嵌套信息结构。HTML文档间的联系完全是平面的,这限制了全文检索技术的应用,也使得浏览的过程显得笨拙而繁琐。

(4) 数据、格式、超文本及图形用户界面语义混合。
  ① 内容提取困难。搜索引擎机械地逐一检索每个页面中所有可以匹配的内容,所以我们往往会得到太多的、难以判断的数据采样。这是由于HTML混淆了数据内容和数据表达,数据内容和数据表达信息都被显式地写在同一文档中的缘故。当我们希望看到用不同表现形式表达的同一内容时(比如需要一个用大号字体排印的版本),就不得不从服务器直接产生。同样,在网页显示上的任何其他变化也都必须由开发者亲自实现。

② 难以实现数据交换。HTML难以实现自动的数据交换,它的标签只用来控制文档的显示,却不能标示出数据域。
  ③ 信息重用性差。HTML不易重复使用已有的信息。如果要重新在网上发布同样的信息,或者希望为已有的信息编辑可打印的目录,或需要把网上的数据存入数据库,往往不得不用手工进行处理,更糟糕的是,当网上的数据发生变化时,这些过程都必须重做。
  HTML存在的这些问题随着互联网的蓬勃发展不但没有得到解决,反而越来越突出,成为HTML继续发展应用的障碍。

 

XML语言的诞生及其优点
1996 年,W3C( 万维网联盟) 寻找一种在Web 中应用SGML 的灵活性和强大功能的方法,这导致了1998 年2 月XML 1.0 规范的发布。XML(eXtensible Markup Language ,可扩展置标语言) 不但具备了SGML 的核心特性,而且非常简洁,XML 规范的内容甚至不到SGML 的1/10 。XML 作为SGML 的子集,同样继承了SGML 的优点—— 扩展性、结构化和有效性。

与HTML相比,XML具有以下几个优点:、

(1) 可扩展性强:
  定义一个标记语言并进行推广和应用,这在XML语言出现之前是非常困难的。一方面,新的标记语言标准化时间很长,从标准提交到相关标准化的建立,要经过几轮的评定和修改,等到正式发布标准时,可能已经过了几年的时间。另一方面,为了推广标准的广泛应用,制定者必须开发相应的标记解释和浏览工具,新的标记语言需要各个厂商进行支持和开发,同样要耗费大量的时间和精力。

(2)遵循严格的语法要求:

    HTML语法要求并不严格,浏览器可以显示有语法错误的HTML文件。例如,“<b>加粗显示”和“<b>加粗显示</b>”这两条语句在浏览器中的显示效果是一样的,但前者明显没有进行标记的配对。
  XML非常注重准确性,在语法结构上只要有丝毫错误,分析器都会停止对XML进行进一步的处理。XML不但要求标记配对、嵌套,而且还要求严格遵守DTD(文档类型定义)的约定。

    XML分析器处理XML文档的过程中不会进行任何猜测和修改,要么文档被判定为正确而执行或显示,要么文档被判定为错误而停止处理。而HTML的标记已成为标准,HTML分析器可以判断出HTML中到底有什么,又缺什么。
  XML分析器的这种严格性大大减轻了浏览器开发人员的负担,也提高了浏览器的效率;同时,严格的语法要求又为XML文档提供了较好的可读性和可维护性。 

(3)数据内容与数据表达分离:

    数据内容和数据表示的分离使数据搜索可以简单高效地进行,搜索引擎没有必要再去遍历整个文档,而只需要找一下相关标记的内容。以上例文档为例,查找价格小于45元的书籍,只要查看<Price>这个标记下的数据是否匹配即可。
  XML中,显示的样式和数据的内容放在不同的文档中。如果要改动信息的表现方式,无需改动信息本身,只要改动与数据文档相关的样式文档就可以了。XML中数据的交换和重用也更加便捷。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值