XML全称eXtensible Markup Language,中文翻译为可扩展标记语言。他和HTML是不一样的,它用来创造标记语言的元语言。
XML来源于SGML(Standard Generalized Markup Language,标准用用标记语言),SGML是一种元语言,即描述标记语言的语言。SGML可用来建立任何类型的标记语言,如报告、乐谱,当然还有网络上最常见的的HTML。SGML的功能非常强大,但设计周期较长,而且也非常复杂,所以其很多特性很少被使用。而由SGML所衍生来的HTML则在整个网络中发挥了重要作用。但随着网络应用越来越广泛,紧靠HTML单一文件类型来处理千变万化的文档和数据已经力不从心,而且HTML本身与法并不严密,严重影响网络信息传递和共享,为解决这些问题,W3C的专家们重新审视了SGML标准,并依照HTML的发展经验,制定出一套规则严谨、使用简单的描述语言,这就是XML。XML于1996年成为W3c协会的提案,并与1998年2月10日成为正式的标准,即XML1.0.
1.声明:
<?xml version="1.0" standalone="yes/no" encoding="UTF-8"?> version表示文档遵守的XML规范的版本;standalone表示此文档是否为独立文档;encoding表示稳当所用的字符集,默认UTF-8,若字符集为简体中文就要改为GB2312;
2.定义根元素:
任何一个XML文档都有且只有一个根元素,而其他元素则都要包含在这个根元素之内根元素的其实标记要放在所有其他元素的起始标记之前,而根元素的结束标记要放在所有其他元素的结束标记之后。
3.定义XML元素:
XML元素由三个部分组成:起始标记、内容、结束标记。起始标记以“<”开始,以“>”结束;而结束标记以“</”开始,以“>”结束。XML中不存在预先定义的元素标记,所以元素标记的名称可自定义,但需要遵循以下规则: 元素名称中可以包含字母、数字以及其他字母; 元素名称不能以数字或下划线开头; 元素名称中不能包含空格和冒号; 元素名称能够描述元素内容。
4.属性的定义:
属性是对元素进一步的描述和说明,一个元素可以有多个属性,每个属性按照由等号分开的名称与值得形式写在元素的开始标记中,属性之间用空格分开。属性值用单引号或双引号括起来。如: <学生 学号=“20070101”性别=“男”>张三</学生> 属性虽然可以扩充元素的信息,但建议尽量不使用属性,而将属性改成子元素。可将上面的代码改成: <学生> 张三 <学号>20070101</学号> <性别>男</性别> </学生> 原因是属性不易扩充和被程序操作。
5.CDATA节:
CDATA全称character data,译为字符数据。CDATA段是用来包含文本的方法,它内部的所有内容都会被XML解析器忽略,所以任何符号都不会被认为是标记符。
XML来源于SGML(Standard Generalized Markup Language,标准用用标记语言),SGML是一种元语言,即描述标记语言的语言。SGML可用来建立任何类型的标记语言,如报告、乐谱,当然还有网络上最常见的的HTML。SGML的功能非常强大,但设计周期较长,而且也非常复杂,所以其很多特性很少被使用。而由SGML所衍生来的HTML则在整个网络中发挥了重要作用。但随着网络应用越来越广泛,紧靠HTML单一文件类型来处理千变万化的文档和数据已经力不从心,而且HTML本身与法并不严密,严重影响网络信息传递和共享,为解决这些问题,W3C的专家们重新审视了SGML标准,并依照HTML的发展经验,制定出一套规则严谨、使用简单的描述语言,这就是XML。XML于1996年成为W3c协会的提案,并与1998年2月10日成为正式的标准,即XML1.0.
1.声明:
<?xml version="1.0" standalone="yes/no" encoding="UTF-8"?> version表示文档遵守的XML规范的版本;standalone表示此文档是否为独立文档;encoding表示稳当所用的字符集,默认UTF-8,若字符集为简体中文就要改为GB2312;
2.定义根元素:
任何一个XML文档都有且只有一个根元素,而其他元素则都要包含在这个根元素之内根元素的其实标记要放在所有其他元素的起始标记之前,而根元素的结束标记要放在所有其他元素的结束标记之后。
3.定义XML元素:
XML元素由三个部分组成:起始标记、内容、结束标记。起始标记以“<”开始,以“>”结束;而结束标记以“</”开始,以“>”结束。XML中不存在预先定义的元素标记,所以元素标记的名称可自定义,但需要遵循以下规则: 元素名称中可以包含字母、数字以及其他字母; 元素名称不能以数字或下划线开头; 元素名称中不能包含空格和冒号; 元素名称能够描述元素内容。
4.属性的定义:
属性是对元素进一步的描述和说明,一个元素可以有多个属性,每个属性按照由等号分开的名称与值得形式写在元素的开始标记中,属性之间用空格分开。属性值用单引号或双引号括起来。如: <学生 学号=“20070101”性别=“男”>张三</学生> 属性虽然可以扩充元素的信息,但建议尽量不使用属性,而将属性改成子元素。可将上面的代码改成: <学生> 张三 <学号>20070101</学号> <性别>男</性别> </学生> 原因是属性不易扩充和被程序操作。
5.CDATA节:
CDATA全称character data,译为字符数据。CDATA段是用来包含文本的方法,它内部的所有内容都会被XML解析器忽略,所以任何符号都不会被认为是标记符。