day16 XML和Dom4j、正则表达式

XML

xml概述:w3c组织发布的,xml种的所有没有预定义,我们可以自定义标签

xml作用:可以用来存储数据,作为配置文件

元素\标签
  1. 元素是XML中最重要的组成部分,元素也叫标签

  2. 标签分为开始标签和结束标签,开始标签<名字> 结束标签</名字>

  3. 开始标签和结束标签中间写的是标签内容,标签的内容可以是文本,也可以是其他标签

  4. 如果标签没有任何内容,那么可以定义空标签(比如:<名字/>)

  5. 标签可以嵌套,但是不能乱嵌套

  6. 一个XML文件只有一个根标签

  7. 命名规则:
    ​ 不要使用XML xML xml 写样的单词

    ​ 不能使用空格,冒号

    ​ 命名区分大小写

    数字不能开头

属性
  1. 格式: 属性的定义格式:属性名=“属性值”,其中属性值必须使用单引或双引号括起来
  2. 属性名不能使用空格 , 不要使用冒号等特殊字符,且必须以字母开头
  3. 空标签也可以有属性

转义字符

注意:严格地讲,在 XML 中仅有字符 “<“和”&” 是非法的。省略号、引号和大于号是合法的,但是把它们替换为实体引用是个好的习惯。

苹果的价格: price > 5 && price < 10

字符区

快捷键 CD

​ <![CDATA[ ​ 苹果的价格: price > 5 && price < 10 ​ ]]>

dom4j
在这里插入图片描述
Dom4J结合XPath解析XML

XPath使用步骤

​ 步骤1:导入jar包(dom4j和jaxen-1.1-beta-6.jar)
​ 步骤2:通过dom4j的SaxReader解析器对象,获取Document对象
​ 步骤3:利用Xpath提供的api,结合xpath的语法完成选取XML文档元素节点进行解析操作。
​ document常用的api

  • document.selectSingleNode(“xpath路径语法”); 获得一个节点(标签,元素)
    electNodes(“xpath路径语法”); 获得多个节点(标签,元素)
    ​ 获取XML文档节点元素一共有如下4种XPath语法方式:
  1. 绝对路径表达式方式 例如: /元素/子元素/子子元素…
    ​ 例如: 子元素/子子元素… 或者 ./子元素/子子元素…

    1. 全文搜索路径表达式方式 例如: //子元素//子子元素
      式 例如: //元素[@attr1=value]

      注意事项

绝对路径是以/开头,并且从根元素开始写路径
相对路径就是相对当前节点元素位置继续查找节点,不以/开头, …/ 表示上一个元素, ./表示当前元素
代表不论中间有多少层,直接获取所有子元素中满足条件的元素
谓语,又称为条件筛选方式,就是根据条件过滤判断进行选取节点
格式:
String xpath1="//元素[@attr1=value]";//获取元素属性attr1=value的元素
在这里插入图片描述
正则表达式

3.2.3 正则表达式-预定义字符

  • 语法示例:

    1. “.” : 匹配任何字符。如果要表示一个字符点,那么就得使用\.

    2. “\d”:任何数字[0-9]的简写;

    3. “\w”:单词字符:[a-zA-Z_0-9]的简写

      3.2.4 正则表达式-数量词

      • 语法示例:
        1. X? : 0次或1次
        2. X* : 0次到多次
        3. X+ : 1次或多次
        4. X{n} : 恰好n次
        5. X{n,} : 至少n次(包含n)
        6. X{n,m}: n到m次(n和m都是包含的) 至少 n 次,但是不超过 m

在这里插入图片描述

第1章 XML简介 1.1 标记语言 1.2 XML的起源和目的 1.3 Web体系结构:过去与未来 1.3.1 传统Web体系结构 1.3.2 XML下的Web体系结构 1.4 XML基本特征 1.5 词汇表 1.5.1 科学词汇表 1.5.2 商业词汇表 1.5.3 法律词汇表 1.5.4 医学词汇表 1.5.5 计算机词汇表 1.6 XML技术的主要特性 1.6.1 格式正规的XML 1.6.2 文档类型定义 1.6.3 数据建模 1.6.4 文档对象模型 1.6.5 XML 简单API 1.6.6 命名空间和模式 1.6.7 链接和查询 1.6.8 转换XML 1.6.9 XML和数据库 1.6.10 服务器到服务器 1.6.11 电子商务与XML 1.6.12 使用样式 1.6.13 无线应用程序协议和WML 1.7 XML的应用程序举例 1.8 小结 第2章 XML语法 2.1 标记语法 2.1.1 字符 2.1.2 命名 2.2 文档部分 2.3 元素 2.3.1 起始标记 2.3.2 结束标记 2.3.3 空元素标记 2.3.4 标记:一个简单的例子 2.3.5 文档元素 2.3.6 子元素 2.3.7 元素嵌套 2.3.8 字符串 2.4 字符数据 2.5 属性 2.5.1 特殊属性 2.5.2 空白 2.5.3 行尾的处理 2.6 字符引用和实体引用 2.6.1 字符引用 2.6.2 实体引用 2.7 处理指令 2.8 注释 2.9 CDATA部分 2.10 文档结构 2.10.1 序言 2.10.2 尾声 2.11 XML语法小结 2.12 格式正规的文档 2.13 解析器 2.13.1 事件驱动的解析器 2.13.2 基于树的解析器 2.13.3 解析器基准测试 2.14 书籍目录应用程序 2.15 小结 第3章 文档类型定义 3.1 为何需要正式的结构 3.1.1 文档域 3.1.2 验证文档的有效性 3.2 编写DTD:通用原则 3.2.1 将DTD与XML文档相关联 3.2.2 基本标记声明 3.3 正式的DTD结构 3.3.1 实体 3.3.2 元素 3.3.3 属性 3.3.4 条件部分 3.4 DTD的缺点 3.5 用于图书目录问题的DTD 3.5.1 图书目录问题的正式定义 3.5.2 对象关系问题 3.5.3 进一步讨论 3.6 小结 第4章 数据建模与XML 4.1 信息建模 4.1.1 静态模型和动态模型 4.1.2 文档和数据 4.1.3 从何处开始 4.1.4 静态信息模型 4.1.5 动态建模:对数据进行哪些处理? 4.2 设计XML文档 4.2.1 XML的两种角色 4.2.2 将信息模型映射到XML 4.3 模式语言和表示法 4.3.1 模式的作用 4.3.2 将DTD作为模式 4.3.3 XML模式建议 4.4 小结 第5章 文档对象模型 5.1 什么是文档对象模型 5.1.1 XML文档结构 5.1.2 为何使用DOM 5.1.3 DOM规范 5.1.4 现实世界中的DOM 5.1.5 特殊的XML DOM实例— HTML DOM 5.2 使用DOM 5.2.1 DOM API 5.2.2 客户端和服务器端 5.2.3 DOM在出版过程中的应用 5.3 使用DOM和XML的应用实例 5.3.1 简单的客户端实例 5.3.2 更复杂的编程实例 5.4 DOM和XML的未来 5.4.1 W3C的工作 5.4.2 应用 5.4.3 数据库、模式和DOM 5.5 小结 第6章 SAX 1.0: XML简易API 6.1 事件驱动接口 6.2 SAX的由来 6.3 SAX的高级特性 6.3.1 可选择的源输入 6.3.2 处理外部实体 6.3.3 选择解析器 6.4 一些SAX设计模式 6.5 SAX 2.0 6.5.1 可配置的接口 6.5.2 核心的特性和属性 6.6 小结 第7章 命名空间和模式 7.1 混合词汇表 7.1.1 分解问题 7.1.2 重用 7.1.3 二义性与名称冲突 7.2 命名空间 7.3 定义和声明命名空间 7.3.1 声明一个命名空间 7.3.2 限定名 7.3.3 范围 7.4 在格式正规的书籍里使用命名空间 实例 7.5 模式 7.5.1 与DTD有关的问题 7.5.2 一个对创建模式的帮助 7.6 W3C在XML 模式方面的工作 7.6.1 DTD与XML 模式的比较 7.6.2 结构 7.6.3 数据类型 7.7 简化了的XML Data 7.7.1 MSXML对命名空间和模式的支持 7.7.2 数据类型 7.8 图书目录中的变化 7.8.1 为什么烦恼 7.8.2 重铸DTD 7.8.3 模式协调 7.9 小结 第8章 链接和查询 8.1 XML 信息集合 8.1.1 信息类型 8.1.2 信息集合的重要性 8.1.3 小结 8.2 链接 8.2.1 什么是链接? 8.2.2 W3C规范:XLink 8.3 Xpointer 8.3.1 HTML指针 8.3.2 Xpointer 规范 8.4 W3C Xpath推荐标准 8.4.1 Location Step 8.4.2 XPointer对XPath的扩展 8.4.3 Xpointer错误 8.4.4 小结 8.5 XML片段交换 8.5.1 什么是文档片段 8.5.2 文档片段的一些用途 8.5.3 问题:Bare文档片段并不总 是充分的 8.5.4 解决办法:环境信息 8.5.5 回顾实例 8.5.6 如何传输片段 8.5.7 小结 8.6 查询 8.6.1 什么是查询语言 8.6.2 关系型数据库和XML文档之间的区别 8.6.3 XML查询语言的发展历史 8.6.4 使用Xpath和XSLT查询XML文档 8.6.5 查询语言展望 8.7 小结 第9章 转换 XML 9.1 为什么转换 XML 9.1.1 在不同词汇表之间转换 9.1.2 动态转换 9.1.3 不同的浏览器 9.2 XSL 9.3 XSLT 样式表结构 9.3.1 创建模板 9.3.2 处理空白 9.3.3 输出格式 9.3.4 合并样式表 9.3.5 嵌入样式表 9.4 使用XSLT的例子 9.4.1 结构的转换 9.4.2 循环 9.4.3 排序 9.4.4 条件处理 9.4.5 名称模板 9.4.6 编号方式 9.4.7 拷贝 9.5 使用DOM进行XML文档的转换 9.5.1 用DOM进行结构的转换 9.5.2 在运行时修改一个XSLT文档 9.6 XSL转换与DOM转换的比较 9.7 小结 第10章 XML和数据库 10.1 存储XML 10.1.1 持续性问题 10.1.2 文档管理 10.1.3 XML存储和数据库 10.1.4 结论 10.2 XML的交换 10.2.1 数据标准 10.2.2 查询标准 10.2.3 结论 10.2.4 你可能需要的标准 10.3 图书目录的例子 10.3.1 处理存在的数据和应用 10.3.2 图书目录模式 10.4 结论 第11章 服务器到服务器 11.1 XML的传送 11.1.1 基于FTP的XML传送 11.1.2 XML和消息队列 11.1.3 基于HTTP的XML 11.1.4 基于SMTP的XML 11.2 作为一种分布式组件模式的XML 11.2.1 消息传送和串行化 11.2.2 紧耦合系统和松耦合系统 11.2.3 通信方式 11.3 XML-RPC 11.3.1 为什么使用XML-RPC 11.3.2 XML-RPC适用于何处 11.3.3 XML-RPC规范—技术全瞻 11.3.4 XML-RPC的实现 11.3.5 书籍应用例子 11.3.6 到哪里去 11.4 SOAP 11.4.1 XML-RPC++ 11.4.2 实现 11.4.3 结论 11.5 WebDAV 11.6 小结 第12章 电子商务和XML 12.1 什么是电子商务 12.1.1 对客户直接销售 12.1.2 企业对企业交易 12.1.3 信息共享和内容联合 12.1.4 EDI—电子数据交换 12.2 在电子商务中应用XML 12.2.1 通常的错误概念 12.2.2 在电子商务中使用XML的感受 12.3 展望未来 12.3.1 发现和调解 12.3.2 容器 12.3.3 代理 12.3.4 模板 12.4 理论转化为实现 12.5 电子商务解决方案 12.6 行业方案 12.6.1 纵向行业解决方案的关键 12.6.2 旅游 12.7 人力资源 12.7.1 HR-XML 12.7.2 健康 12.8 cXML—纵向行业的一个详细 例子 12.8.1 为什么有cXML 12.8.2 cXML协议规范 12.8.3 消息传输 12.9 第1步—横向行业 12.9.1 ASC X12 12.9.2 XML-EDIFACT 12.9.3 电子商务XML工作组 12.10 第1个横向步骤 12.10.1 BizTalk标记规范 12.10.2 规范的目标和当前的限制 12.10.3 文档结构 12.10.4 一个用于Wrox书店的BizTalk 文档 12.10.5 BizTalk Jumpstart工具包简介 12.10.6 BizTalk服务器 12.11 小结 第13章 样式XML 13.1 解释的位置 13.2 客户端的XML转换 13.3 解释模型 13.3.1 视觉解释 13.3.2 语音解释 13.3.3 如何将样式表链接到XML文档上 13.3.4 规则语言 13.3.5 CSS 13.3.6 XSL 13.3.7 用XSL解释XML 13.3.8 DSSSL 13.3.9 Omnimark 13.4 小结 第14章 无线应用协议 14.1 新客户介绍 14.2 了解无线环境 14.2.1 服务 14.2.2 无线网络 14.2.3 WAP如何解决无线网络应用遇到 的问题 14.3 介绍WML 14.3.1 怎样将第一份文档传送到电话上 14.3.2 WML文档的结构 14.3.3 通用属性 14.3.4 WML包括什么 14.3.5 Meta信息 14.3.6 基本字符、表格和演示 14.3.7 使用计时器 14.3.8 事件处理器 14.3.9 使用变量 14.3.10 任务和菜单 14.3.11 客户端模板 14.3.12 表单数据 14.3.13 图像 14.4 在服务器上生成WML 14.5 WROX的WML应用 14.6 WML脚本 14.6.1 基本概念 14.6.2 字节码 14.6.3 如何从WML上调用脚本函数 14.7 脚本库 14.7.1 决定浏览器的状态—WMLBrowser 脚本库 14.7.2 Dialogs库 14.7.3 特定的语言函数 14.7.4 浮点数 14.7.5 字符串 14.7.6 URL 14.8 如何得到更多的信息 14.9 小结 第15章 实例研究1─数据双重性 15.1 商业需求 15.2 系统要求 15.3 设计时间:让我们开始吧 15.4 实现方法概述 15.5 建立数据库 15.6 提供XML功能的ASP 15.7 客户端页面 15.8 “以编号浏览”XSL样式表 15.9 “以名字浏览”XSL样式表 15.10 激活XSL样式表 15.11 问题:保持树的同步 15.12 小结 第16章 实例研究2—XML和分布式 应用程序 16.1 目前的弱点 16.2 构建网络应用程序的五条原则 16.2.1 从粗粒度服务构建应用程序 16.2.2 通过查询目录发现服务 16.2.3 将服务提供为自描述数据 16.2.4 服务是短暂的 16.2.5 服务必须可扩展,且能够降低对 外部的要求 16.3 商业实例 16.4 应用程序设计 16.4.1 应用程序的组织 16.4.2 程序员服务客户端 16.4.3 服务 16.4.4 交换词汇表 16.5 实现 16.5.1 定位服务 16.5.2 管理数据绑定 16.6 输入和编辑程序员信息 16.6.1 客户端 16.6.2 服务器端 16.6.3 用于插入程序员信息的完整客户端 代码 16.6.4 用于插入程序员信息的完整服务器端 代码 16.7 搜索程序员信息 16.7.1 客户端 16.7.2 服务器端 16.8 清除程序员表单 16.9 输入程序员成果报告 16.9.1 客户端 16.9.2 服务器端 16.10 清除成果报告历史表单 16.11 获取程序员的成果历史 16.11.1 客户端 16.11.2 服务器端 16.12 经验教训 16.12.1 违反的开发原则 16.12.2 组件 16.12.3 重用的可能性 16.13 小结 第17章 实例研究3—图书目录信息服务 17.1 图书目录信息服务 17.1.1 系统概述 17.1.2 创建BCIS 17.2 小结 第18章 实例研究4--SOAP 18.1 追根溯源 18.2 SOAP Opera 18.2.1 OPERA客户端 18.2.2 OPERA服务器 18.2.3 订单输入应用程序 18.2.4 对象 18.3 小结 附录A 可扩展标记语言(XML)1.0 规范 附录B IE 5 XML文档对象模型 附录C SAX 1.0:XML简单API 附录D IE 5 XML模式和数据类型 附录E IE 5 XSL引用 附录F CSS属性 附录G 安装XT 附录H 支持与勘误
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值