xml是可扩展的标记性语言。
xml的主要作用有:
1. 用来保存数据,而且这些数据具有自我描述性
2. 它还可以作为项目或者模块的配置文件
3. 还可以作为网络传输数据的格式(现在以JSON为主)
xml的标签属性和html的标签属性是非常类似的,属性可以提供元素的额外信息
一个标签上可以书写多个属性。每个属性的值必须使用引号引起来
所有xml元素都须有关闭标签(也就是闭合)
xml标签对大小写敏感
xml必须正确地嵌套
xml文档必须有根元素,根元素就是顶级元素,没有父标签的元素叫顶级元素,根元素是没有父标签的顶级元素,而且是唯一一个才行
xml中的特殊字符
< 的特殊字符:<
>的特殊字符:>
文本区域(CDATA区):
CDATA语法可以告诉解析器,在CDATA里的文本内容只是纯文本,不需要xml语法解析
CDATA格式:
<![CDATA[ 这里可以把你输入的字符原样显示,不会解析xml]]>
xml是可扩展的标记语言
不管是html文件还是xml文件它们都是标记型文档,都可以使用w3c组织制定的dom技术来解析。
dom4j是第三方的解析技术,我们需要使用第三方给我们提供好的类库才可以解析xml文件。
下载dom4j解压后得到的文件目录:
docs是文档目录
lib目录是dom4j需要依赖的其他第三方类库
src目录是第三方类库的源码目录
dom4j编程的步骤:
第一步:先加载xml文件创建Document对象
第二步:通过Document对象拿到根元素对象
第三步:通过根元素.elements(标签名);可以返回一个集合,这个集合里放着所有你指定的标签名的元素对象
第四步:找到你想要修改、删除的子元素,进行相应的操作
第五步:保存到硬盘上
获取document对象
创建一个lib目录,并添加dom4j的jar包,并添加到类路径
需要解析的books.xml文件内容
解析获取Document对象的代码
第一步,先创建SAXReader对象,这个对象用于读取xml文件,并创建Document
遍历标签获取所有标签中的内容:
第一步,通过创建SAXReader对象。来读取xml文件,获取Document对象
第二步,通过Document对象。拿到XML的根元素对象
第三步,通过根元素对象,获取到所有的book标签对象
第四步,遍历每个book标签对象。然后获取到book标签对象内的每一个元素,再通过getText()方法拿到起始标签和结束标签之间的文本内容