xml文件解析


XML解析:
两种:dom解析:一次解析不用重复解析。可以很方便对xml进行增删改查,缺点:每个节点都是对象,dom解析占用内存很大。

      sax解析:逐步扫描整个xml文档在扫描过程中对于事件会去调用事件处理器中的对应方法处理事件,
               sax解析非常快,sax占用内存很少。只能读取数据,不能对xml中的数据进行增删改操作。

 

sax 解析代码:

package com.itheima;

import javax.xml.parsers.SAXParser;
import javax.xml.parsers.SAXParserFactory;

import org.xml.sax.Attributes;
import org.xml.sax.ContentHandler;
import org.xml.sax.Locator;
import org.xml.sax.SAXException;
import org.xml.sax.XMLReader;
import org.xml.sax.helpers.DefaultHandler;


public class SaxParseXml {
 public static void main(String[] args) throws Exception {
  //使用SAXParserFactory获得创建SAX的工厂
  SAXParserFactory saxf= SAXParserFactory.newInstance();
  //获取SAX解析工厂得到解析器对象
  SAXParser sp = saxf.newSAXParser();
  //通过解析器对象得到一个xml的读取器
  XMLReader xmlReader = sp.getXMLReader();
  //设置读取器的事件处理器
  xmlReader.setContentHandler(new MyContentHandler2());
  //解析xml文件
  xmlReader.parse("book.xml");
 }
}
class MyContentHandler2 extends DefaultHandler{
 private boolean flag = false;
 private int count = 0;
 @Override
 public void startElement(String uri, String localName, String qName,
   Attributes attributes) throws SAXException {
  if("书名".equals(qName)){
   flag = true;
   count ++;
  }
 }
 @Override
 public void characters(char[] ch, int start, int length) throws SAXException {
  if(flag && count == 2)
  System.out.println(new String(ch,start,length));
 };
 public void endElement(String uri, String localName, String qName)
   throws SAXException {
  if("书名".equals(qName)){
   flag = false;
  }
 }
}
class MyContentHandler implements ContentHandler{
 private boolean flag = false;
 private int count = 0;
 @Override
 public void startDocument() throws SAXException {
  System.out.println("开始解析book.xml文件");
 }
 @Override
 public void endDocument() throws SAXException {
  System.out.println("book.xml解析结束");
 }
 @Override
 public void startElement(String uri, String localName, String qName,
   Attributes atts) throws SAXException {
  System.out.println(uri+qName);
  if("书名".equals(qName)){
   flag = true;
   count++;
  }
 }
 @Override
 public void characters(char[] ch, int start, int length)
   throws SAXException {
  if(flag && count == 2){
   String bookName = new String(ch, start, length);
   System.out.println(bookName);
  }
 }
 @Override
 public void endElement(String uri, String localName, String qName)
   throws SAXException {
  System.out.println(uri+qName);
  if("书名".equals(qName)){
   flag = false;
  }
 }

 @Override
 public void setDocumentLocator(Locator locator) {
  
 }
 @Override
 public void startPrefixMapping(String prefix, String uri)
   throws SAXException {
  // TODO Auto-generated method stub
  
 }

 @Override
 public void endPrefixMapping(String prefix) throws SAXException {
  // TODO Auto-generated method stub
  
 }

 

 @Override
 public void ignorableWhitespace(char[] ch, int start, int length)
   throws SAXException {
  // TODO Auto-generated method stub
  
 }

 @Override
 public void processingInstruction(String target, String data)
   throws SAXException {
  // TODO Auto-generated method stub
  
 }

 @Override
 public void skippedEntity(String name) throws SAXException {
  // TODO Auto-generated method stub
  
 }
 
}

 doc解析:

doc解析:
     1、查找元素:
      /**
查找
**/
@Test
public  void getElement() throws Exception{
//构造sax解析器
SAXReader sax = new SAXReader();
//得到documet对象
Document document = sax.read("book.xml");
//得到root根节点
Element root = document.getRootElement();

System.out.println(root);
//获得书名元素
Element el = root.element("书").element("书名");
System.out.println(el.getText());


//遍历所以书名的元素
@SuppressWarnings("unchecked")
List<Element> elements = root.elements("书");
Element book2Name = elements.get(1).element("书名");
System.out.println(book2Name.getText());


}
/**
* 查找属性
* @throws Exception
*/
@Test
public  void getAttribution() throws Exception{
//构造Sax解析器
SAXReader reader = new SAXReader();
//获得document对象
Document document = reader.read("book.xml");
//获得根节点
Element note = document.getRootElement();
//获得元素
Element book = note.element("书");
//获得元素的属性
Attribute bookAttr = book.attribute(0);
//获得元素的所有属性
@SuppressWarnings({ "unused", "unchecked" })
List<Attribute> bookAttrs = book.attributes();
String name = bookAttr.getName();
System.out.println(name+":"+bookAttr.getValue());
}
      2、添加元素:注意要把元素写回 xml文件里
      public void addElement() throws Exception {
//构造sax解析器
SAXReader sax = new SAXReader();
//得到documet对象
Document document = sax.read("book.xml");
//得到root根节点
Element root = document.getRootElement();
//获取父节点
Element shu = root.element("书");
//2.用DocumentHelper的createElement创建特价节点
Element tejia = DocumentHelper.createElement("特价");
tejia.setText("99.9");
//把元素写的父节点上
shu.add(tejia);
//把元素写回xml里
//方法一:
/*XMLWriter xmlWriter = new XMLWriter(new FileWriter("book.xml"),OutputFormat.createPrettyPrint());
xmlWriter.write(document);
xmlWriter.close();*/
//方法二:
Writer write = new OutputStreamWriter(new FileOutputStream("book.xml"), "utf-8");
document.write(write);
write.flush();
write.close();

}
     3、 修改元素
        public void updateElement() throws Exception {
//构造sax解析器
SAXReader sax = new SAXReader();
//得到documet对象
Document document = sax.read("book.xml");
//得到root根节点
Element root = document.getRootElement();
//得到要修改的元素
Element tejia = root.element("书").element("特价");
tejia.setText("12");
//数据回写
Writer write = new OutputStreamWriter(new FileOutputStream("book.xml"), "utf-8");
document.write(write);
write.flush();
write.close();
     }
     4、 删除元素


     public void deleteElement() throws Exception{
//构造解析器
SAXReader sax = new SAXReader();
//获取document对象
Document doc = sax.read("book.xml");
//得到root节点
Element root = doc.getRootElement();
//得到要删除的节点
Element tejia = root.element("书").element("特价");
tejia.getParent().remove(tejia);
//写回xml里
Writer writer = new OutputStreamWriter(new FileOutputStream("book.xml"),"utf-8");
doc.write(writer);
writer.flush();
writer.close();

}

 xpath
   1、xpath 的基本语法:
       a)基本的XPath语法类似于在一个文件系统中定位文件,如果路径以斜线 / 开始, 那么该路径就表示到一个元素的绝对路径   /AAA
       b)如果路径以双斜线 // 开头, 则表示选择文档中所有满足双斜线//之后规则的元素(无论层级 关系) //BBB  
       c)星号 * 表示选择所有由星号之前的路径所定位的元素 /AAA/CCC/DDD/*
       d)方块号里的表达式可以进一步的指定元素, 其中数字表示元素在选择集里的位置, 而last()函 数则表示选择集中的最后一个元素./AAA/BBB[1] and /AAA/BBB[last()]
       e)选择所有的id属性 //@id //BBB[@id]
       f)属性的值可以被用来作为选择的准则, normalize-space函数删除了前部和尾部的空格, 并且 把连续的空格串替换为一个单一的空格 //BBB[@id='b1'] and //BBB[normalize-space(@name)='bbb']
       g)count()函数可以计数所选元素的个数 //*[count(BBB)=2] 选择含有2个BBB子元素的元素


      public void learnXpath() throws Exception{
//获取解析器
SAXReader sax = new SAXReader();
//获得document
Document doc =sax.read("book.xml");
//获取根元素
Element root = doc.getRootElement();
//匹配要获得的元素
//List<Element> els = root.selectNodes("/书架/书");
//List<Element> els = root.selectNodes("//书");
//List<Element> els = root.selectNodes("//书/*");
//List<Element> els = root.selectNodes("//书/*[2]");
List<Element> els = root.selectNodes("//书[@id]");
System.out.println(els.get(0).getName());

}

book.xml:

<?xml version="1.0" encoding="gb2312"?>
<书架>
 <书>
  <书名>Java就业培训教程</书名>
  <作者>张孝祥</作者>
  <售价>39.00元</售价>
 </书>
 <书>
  <书名>JavaScript网页开发</书名>
  <作者>张孝祥</作者>
  <售价>28.00元</售价>
 </书>
</书架>

Python网络爬虫与推荐算法新闻推荐平台:网络爬虫:通过Python实现新浪新闻的爬取,可爬取新闻页面上的标题、文本、图片、视频链接(保留排版) 推荐算法:权重衰减+标签推荐+区域推荐+热点推荐.zip项目工程资源经过严格测试可直接运行成功且功能正常的情况才上传,可轻松复刻,拿到资料包后可轻松复现出一样的项目,本人系统开发经验充足(全领域),有任何使用问题欢迎随时与我联系,我会及时为您解惑,提供帮助。 【资源内容】:包含完整源码+工程文件+说明(如有)等。答辩评审平均分达到96分,放心下载使用!可轻松复现,设计报告也可借鉴此项目,该资源内项目代码都经过测试运行成功,功能ok的情况下才上传的。 【提供帮助】:有任何使用问题欢迎随时与我联系,我会及时解答解惑,提供帮助 【附带帮助】:若还需要相关开发工具、学习资料等,我会提供帮助,提供资料,鼓励学习进步 【项目价值】:可用在相关项目设计中,皆可应用在项目、毕业设计、课程设计、期末/期中/大作业、工程实训、大创等学科竞赛比赛、初期项目立项、学习/练手等方面,可借鉴此优质项目实现复刻,设计报告也可借鉴此项目,也可基于此项目来扩展开发出更多功能 下载后请首先打开README文件(如有),项目工程可直接复现复刻,如果基础还行,也可在此程序基础上进行修改,以实现其它功能。供开源学习/技术交流/学习参考,勿用于商业用途。质量优质,放心下载使用。
1、资源项目源码均已通过严格测试验证,保证能够正常运行; 2、项目问题、技术讨论,可以给博主私信或留言,博主看到后会第一时间与您进行沟通; 3、本项目比较适合计算机领域相关的毕业设计课题、课程作业等使用,尤其对于人工智能、计算机科学与技术等相关专业,更为适合; 4、下载使用后,可先查看README.md或论文文件(如有),本项目仅用作交流学习参考,请切勿用于商业用途。 5、资源来自互联网采集,如有侵权,私聊博主删除。 6、可私信博主看论文后选择购买源代码。 1、资源项目源码均已通过严格测试验证,保证能够正常运行; 2、项目问题、技术讨论,可以给博主私信或留言,博主看到后会第一时间与您进行沟通; 3、本项目比较适合计算机领域相关的毕业设计课题、课程作业等使用,尤其对于人工智能、计算机科学与技术等相关专业,更为适合; 4、下载使用后,可先查看README.md或论文文件(如有),本项目仅用作交流学习参考,请切勿用于商业用途。 5、资源来自互联网采集,如有侵权,私聊博主删除。 6、可私信博主看论文后选择购买源代码。 1、资源项目源码均已通过严格测试验证,保证能够正常运行; 2、项目问题、技术讨论,可以给博主私信或留言,博主看到后会第一时间与您进行沟通; 3、本项目比较适合计算机领域相关的毕业设计课题、课程作业等使用,尤其对于人工智能、计算机科学与技术等相关专业,更为适合; 4、下载使用后,可先查看README.md或论文文件(如有),本项目仅用作交流学习参考,请切勿用于商业用途。 5、资源来自互联网采集,如有侵权,私聊博主删除。 6、可私信博主看论文后选择购买源代码。
1、资源项目源码均已通过严格测试验证,保证能够正常运行; 2、项目问题、技术讨论,可以给博主私信或留言,博主看到后会第一时间与您进行沟通; 3、本项目比较适合计算机领域相关的毕业设计课题、课程作业等使用,尤其对于人工智能、计算机科学与技术等相关专业,更为适合; 4、下载使用后,可先查看README.md或论文文件(如有),本项目仅用作交流学习参考,请切勿用于商业用途。 5、资源来自互联网采集,如有侵权,私聊博主删除。 6、可私信博主看论文后选择购买源代码。 1、资源项目源码均已通过严格测试验证,保证能够正常运行; 2、项目问题、技术讨论,可以给博主私信或留言,博主看到后会第一时间与您进行沟通; 3、本项目比较适合计算机领域相关的毕业设计课题、课程作业等使用,尤其对于人工智能、计算机科学与技术等相关专业,更为适合; 4、下载使用后,可先查看README.md或论文文件(如有),本项目仅用作交流学习参考,请切勿用于商业用途。 5、资源来自互联网采集,如有侵权,私聊博主删除。 6、可私信博主看论文后选择购买源代码。 1、资源项目源码均已通过严格测试验证,保证能够正常运行; 2、项目问题、技术讨论,可以给博主私信或留言,博主看到后会第一时间与您进行沟通; 3、本项目比较适合计算机领域相关的毕业设计课题、课程作业等使用,尤其对于人工智能、计算机科学与技术等相关专业,更为适合; 4、下载使用后,可先查看README.md或论文文件(如有),本项目仅用作交流学习参考,请切勿用于商业用途。 5、资源来自互联网采集,如有侵权,私聊博主删除。 6、可私信博主看论文后选择购买源代码。
各种安全相关思维导图整理收集。渗透步骤,web安全,CTF,业务安全,人工智能,区块链安全,数据安全,安全开发,无线安全,社会工程学,二进制安全,移动安全,红蓝对抗,运维安全,风控安全,linux安全.zip项目工程资源经过严格测试可直接运行成功且功能正常的情况才上传,可轻松复刻,拿到资料包后可轻松复现出一样的项目,本人系统开发经验充足(全领域),有任何使用问题欢迎随时与我联系,我会及时为您解惑,提供帮助。 【资源内容】:包含完整源码+工程文件+说明(如有)等。答辩评审平均分达到96分,放心下载使用!可轻松复现,设计报告也可借鉴此项目,该资源内项目代码都经过测试运行成功,功能ok的情况下才上传的。 【提供帮助】:有任何使用问题欢迎随时与我联系,我会及时解答解惑,提供帮助 【附带帮助】:若还需要相关开发工具、学习资料等,我会提供帮助,提供资料,鼓励学习进步 【项目价值】:可用在相关项目设计中,皆可应用在项目、毕业设计、课程设计、期末/期中/大作业、工程实训、大创等学科竞赛比赛、初期项目立项、学习/练手等方面,可借鉴此优质项目实现复刻,设计报告也可借鉴此项目,也可基于此项目来扩展开发出更多功能 下载后请首先打开README文件(如有),项目工程可直接复现复刻,如果基础还行,也可在此程序基础上进行修改,以实现其它功能。供开源学习/技术交流/学习参考,勿用于商业用途。质量优质,放心下载使用。
1、资源项目源码均已通过严格测试验证,保证能够正常运行; 2、项目问题、技术讨论,可以给博主私信或留言,博主看到后会第一时间与您进行沟通; 3、本项目比较适合计算机领域相关的毕业设计课题、课程作业等使用,尤其对于人工智能、计算机科学与技术等相关专业,更为适合; 4、下载使用后,可先查看README.md或论文文件(如有),本项目仅用作交流学习参考,请切勿用于商业用途。 5、资源来自互联网采集,如有侵权,私聊博主删除。 6、可私信博主看论文后选择购买源代码。 1、资源项目源码均已通过严格测试验证,保证能够正常运行; 2、项目问题、技术讨论,可以给博主私信或留言,博主看到后会第一时间与您进行沟通; 3、本项目比较适合计算机领域相关的毕业设计课题、课程作业等使用,尤其对于人工智能、计算机科学与技术等相关专业,更为适合; 4、下载使用后,可先查看README.md或论文文件(如有),本项目仅用作交流学习参考,请切勿用于商业用途。 5、资源来自互联网采集,如有侵权,私聊博主删除。 6、可私信博主看论文后选择购买源代码。 1、资源项目源码均已通过严格测试验证,保证能够正常运行; 2、项目问题、技术讨论,可以给博主私信或留言,博主看到后会第一时间与您进行沟通; 3、本项目比较适合计算机领域相关的毕业设计课题、课程作业等使用,尤其对于人工智能、计算机科学与技术等相关专业,更为适合; 4、下载使用后,可先查看README.md或论文文件(如有),本项目仅用作交流学习参考,请切勿用于商业用途。 5、资源来自互联网采集,如有侵权,私聊博主删除。 6、可私信博主看论文后选择购买源代码。
1、资源项目源码均已通过严格测试验证,保证能够正常运行; 2、项目问题、技术讨论,可以给博主私信或留言,博主看到后会第一时间与您进行沟通; 3、本项目比较适合计算机领域相关的毕业设计课题、课程作业等使用,尤其对于人工智能、计算机科学与技术等相关专业,更为适合; 4、下载使用后,可先查看README.md或论文文件(如有),本项目仅用作交流学习参考,请切勿用于商业用途。 5、资源来自互联网采集,如有侵权,私聊博主删除。 6、可私信博主看论文后选择购买源代码。 1、资源项目源码均已通过严格测试验证,保证能够正常运行; 2、项目问题、技术讨论,可以给博主私信或留言,博主看到后会第一时间与您进行沟通; 3、本项目比较适合计算机领域相关的毕业设计课题、课程作业等使用,尤其对于人工智能、计算机科学与技术等相关专业,更为适合; 4、下载使用后,可先查看README.md或论文文件(如有),本项目仅用作交流学习参考,请切勿用于商业用途。 5、资源来自互联网采集,如有侵权,私聊博主删除。 6、可私信博主看论文后选择购买源代码。 1、资源项目源码均已通过严格测试验证,保证能够正常运行; 2、项目问题、技术讨论,可以给博主私信或留言,博主看到后会第一时间与您进行沟通; 3、本项目比较适合计算机领域相关的毕业设计课题、课程作业等使用,尤其对于人工智能、计算机科学与技术等相关专业,更为适合; 4、下载使用后,可先查看README.md或论文文件(如有),本项目仅用作交流学习参考,请切勿用于商业用途。 5、资源来自互联网采集,如有侵权,私聊博主删除。 6、可私信博主看论文后选择购买源代码。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值