JavaWeb入门基础---XML入门

这篇博客详细介绍了XML的基础知识,包括XML概述、元素规则、命名空间、XPath语言,以及DOM、SAX和JAXP解析XML的方法。XML作为一种可扩展标记语言,主要用于数据的存储和传输,其优势在于数据逻辑和显示逻辑分离,允许自由定义标签。此外,文中还讲解了XML的元素规则,如标签命名、元素嵌套和空元素,以及如何处理特殊字符。XPath作为导航语言,用于在XML文档中查找信息。最后,讨论了SAX解析和生成XML文档的机制。
摘要由CSDN通过智能技术生成

目录

 

XML

XML概述

XML元素的基本规则

XML命名空间

XPath语言

XPath基本概念

DOM、SAX和JAXP

SAX解析XML文档

SAX生成XML文档


XML

XML概述

  • XML可扩展标记语言。
  • 允许开发者自由定义标签,可以将标签和内容有效分离。
  • XML不再侧重于数据如何展示,而是更多的关注数据如何存储和传输。

XML的应用场景

  1. XML把数据从HTML分离出来
  2. 简化数据共享
  3. 简化数据的传输
  4. 简化平台的变更

XML的优势

  • 简单易用的标记语言
  • 严格的格式
  • 数据逻辑和显示逻辑分离

<?xml version="1.0" encoding="UTF-8"?>
<teaching-plan attribute="教学计划">
 
	<course attribute="课程">
		<course-name attribute="课程名">大学英语</course-name>
		<class-hour attribute="课时">36</class-hour>
		<exam-form attribute="考核方式">考试</exam-form>
	</course>
	
	<course attribute="课程">
		<course-name attribute="课程名">高等数学</course-name>
		<class-hour attribute="课时">70</class-hour>
		<exam-form attribute="考核方式">考试</exam-form>
	</course>
	
	<course attribute="课程">
		<course-name attribute="课程名">计算机应用基础</course-name>
		<class-hour attribute="课时">108</class-hour>
		<exam-form attribute="考核方式">上机考试</exam-form>
	</course>
	
 
</teaching-plan>

XML的整体结构

  1. 有且只有一个根元素
  2. 元素必须合理结束
  3. 元素之间必须合理嵌套
  4. 元素的属性必须有值

XML声明
<?xml version=“1.0 encoding=“GB2312” standalone="yes"?>

字符集

  1. 简体中文:GBK或GB2312
  2. 繁体中文BIG5
  3. 西欧字符ISO8859-1
  4. 通用的国际编码  Unicode
  5. 针对 Unicode的可变长度字符编码:UTF8

XML元素的基本规则

1.合法标签名

  • XML元素由开始标签和结束标签组成,结束标签比开始标签多一条斜线
  • XML文档区分大小写,因此,开始标签和结束标签必须绝对相同,大小写也要完全一致
  • XML文档对于标签名有如下要求:
    • 标签名可以字母(包括非西欧字符)、数字、下画线(_)、中画线(一)、冒号(:)和点号(.)组成,但不能以数字、中画线和点号开头
    • ·标签名不能包括<、>、,、$等符号
    • ·标签名中尽量不要出现英文冒号:,除非是在使用名字空间
    • 标签名不能以字符“xml"(或者XML、Xml等任意大小写组合开始)
    • 标签名不能包含空格

2.嵌套子元素

  • XML允许无限深度嵌套子元素,只要保证元素之间合理嵌套即可
  • XML元素可以嵌套多个重名的子元素,这多个元素之间是有序的

3.空元素

  • XML允许使用空元素语法,空元素不可接受子元素,也不可接受字符串内容
  • 空元素和内容为空的元素并不相同
  • 空元素只是不能包含子元素,也不能包含字符串内容,但完全可以接受属性而且可以接受任意多个属性

字符数据

  • 开始标签和结束标签之间的文本可以是任何Unicole字符,并且其间的任何字符都将忠实地传递给XML处理程序
  • 如果文本字符串中包含一些特殊的字符,例如尖括号(<)或and符号(&)由于这些符号在XML文档中都有特殊的含义,因此直接在XML元素中使用该字符串将引起文档混乱

1.使用实体引用
为了正确处理XML文档中的特殊字符,ⅩML允许使用实体来表示这些特殊字符。
XML预置了5个实体引用,如表


2.使用 CDATA标记
在特殊标记 CDATA下,所有的特殊字符,甚至是有效的元素都将被当成简单字符处理实体引用也会失去作用,变成纯文本
语法:
<! [CDATA[文本内容]]>

注释<

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值