信息标记
实际应用中的原始数据往往是杂乱无章的,为了更加方便组织和存储各种信息,以及为计算机处理、传播消息提供一种统一的方法。必须对信息进行一定的标记,信息标记的特点一般有以下几点:
1、标记后的信息可形成信息组织结构,增加了信息维度
2、标记的结构与信息一样具有重要价值
3、标记后的信息可用于通信、存储或展示
4、标记后的信息更利于程序理解和运用
常用的信息标记主要有XML、JSON、YAML三种,基于WWW(World Wide Web)的信息组织方式是HTML(HyperText Markup Language,超文本标记语言)。
XML(可扩展标记语言)
XML简介
XML(Extensible Markup Language)即可扩展标记语言,标准通用标记语言的子集,是一种用于标记电子文件使其具有结构性的标记语言。
在电子计算机中,标记指计算机所能理解的信息符号,通过此种标记,计算机之间可以处理包含各种的信息比如文章等。它可以用来标记数据、定义数据类型,是一种允许用户对自己的标记语言进行定义的源语言。 它非常适合万维网传输,提供统一的方法来描述和交换独立于应用程序或供应商的结构化数据。是Internet环境中跨平台的、依赖于内容的技术,也是当今处理分布式结构信息的有效工具。
1998年2月,W3C正式批准了可扩展标记语言的标准定义,可扩展标记语言可以对文档和数据进行结构化处理,从而能够在部门、客户和供应商之间进行交换,实现动态内容生成,企业集成和应用开发。可扩展标记语言可以使我们能够更准确的搜索,更方便的传送软件组件,更好的描述一些事物。例如电子商务交易等。
XML和HTML都是标准通用标记语言的子集,XML是被设计用来传输和存储数据,而HTML是被设计用来显示数据的。
XML语言具有如下一些特点:
1、可扩展标记语言是一种很像超文本标记语言的标记语言。
2、它的设计宗旨是传输数据,而不是显示数据。
3、它的标签没有被预定义。需要自行定义标签。
4、它被设计为具有自我描述性。
5、它是W3C的推荐标准。
XML与HTML的区别
1、XML不是HTML的替代。而是对HTML的补充。
2、它和HTML为不同的目的而设计:XML被设计用来传输和存储数据,其焦点是数据的内容。HTML被设计用来显示数据,其焦点是数据的外观。
3、HTML旨在显示信息,而XML旨在传输信息。对XML最好的描述是:它是独立于软件和硬件的信息传输工具。