1.置标语言
所谓置标语言(markup language),则特指用一系列约定好的标记来对电子文档进行标记,来实现对电子文档的语义、结构、格式的定义。
2. SGML语言起源
20世纪60年代,IBM公司创建了GML(Generalized Markup Language,通用置标语言),
SGML(Standard Generalized Markup Language,标准通用置标语言)从IBM的GML演化而来,是第一个标准化的信息结构化技术。SGML后来被扩展和修改,直到1986年,SGML才成为了ISO标准。
3. HTML语言及其局限性
HTML(Hyper Text Markup Language,超文本标记语言)是一种用来制作超文本文档的简单标记语言。用HTML编写的超文本文档称为HTML文档,它能独立于各作操作系统平台(如UNIX、Windows等),HTML语言是通过利用各种标记(tags)来标识文档的结构及超链接信息的。
HTML之所以能够流行,是因为它有简洁的语法,但也正是由于它过于简洁,也产生了以下几个主要问题:
(1) 标记扩展复杂。
(2) 缺乏严格的语法定义。
(3) 结构化支持差。
(4) 数据、格式、超文本及图形用户界面语义混合
① 内容提取困难 ② 难以实现数据交换。③ 信息重用性差
4. XML语言的诞生及其优点
XML(eXtensible Markup Language,可扩展置标语言)不但具备了SGML的核心特性,而且非常简洁,XML规范的内容甚至不到SGML的1/10。XML作为SGML的子集,同样继承了SGML的优点——扩展性、结构化和有效性