SAX解析xml,characters方法遇到的问题

SAX是基于事件处理xml,需要你继承DefaultHandler类,并且覆盖相应的方法,比如startDocument,endDocument,startElement,endElement,characters等,这里主要说一下characters方法,闲话少说,先说问题。

问题:用characters方法截取标记之间的文本内容,如:<kpiversion>WL_LTE_CORBA_PM_V1.1.0</kpiversion>。但是大数据的xml中,会出现部分字段丢失的问题。90%的截取是没有问题的,另外10%会只截取到部分文本,如只截取到WL_,后面的字串丢失了。

characters定义了三个参数(public void characters(char[] arg0, int arg1, int arg2) throws SAXException),第一个参数是字符数组,第二个是截取的起始位置,第三个是截取的长度。理所当然的认为想要取到中间文本数据,可以如下调用:

public void characters(char[] arg0, int arg1, int arg2) throws SAXException {
		
		this.content =new String(arg0, arg1, arg2);
		    
		
}
以为这样就可以得到值,其实这个不正确的,查找资料也证实了,原因是因为两个标记之间的文本大小是不知道的,而char[]是有最大值的,如果超过了2048,他会分几次来调用chatacters方法,第一次取一部分,第二次去后面的,第三次,第四次,直到把文本取完。

但如果本文大小不超过2048,好像有时也会分几次来取,正如我遇到的问题,其实本文并不大,只有十几个字符,但是断点跟踪是发现,第一个只取了前三个字符,所以我用上面定义的characters方法,就只得到了前三个字符。


正确的处理方式应该是:定义一个StringBuffer,在characters方法中重复的拼接,或者利用String直接拼接,直到解析完该标记间的文本。然后在endElement方法中使用解析出的文本,代码如下:

public void characters(char[] arg0, int arg1, int arg2) throws SAXException {
		
		this.content = this.content+new String(arg0, arg1, arg2);
		    
		
	}

public void endElement(String uri, String localName, String qName)
		throws SAXException {
		
		
		if(toptag!=null && toptag.equalsIgnoreCase("liststorefield")){
       	 
        	    if(oneAlgorithm!=null && currenttag!=null && currenttag.equalsIgnoreCase("carrierid")){
        		Integer num = Integer.parseInt(content);
        		if(num!=null){
        			oneAlgorithm.setCarrier_id(num);
        		}
    		   }
               }
}

这样字串丢失的问题就解决了。

希望能帮到后来者,呵呵


  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
SAX解析是一种基于事件驱动的XML解析方法。它通过逐行读取XML文档并触发相应的事件来解析XML数据。在SAX解析中,有三个核心步骤: 1. 获取XML解析器:可以通过Java原生API获取XML解析器。使用`javax.xml.parsers.SAXParserFactory`类获取解析器的实例,然后使用`factory.newSAXParser()`方法获取`SAXParser`对象,最后通过`saxParser.getXMLReader()`方法获取`XMLReader`对象。 2. 注册自定义解析器:在SAX解析中,需要注册一个自定义的事件处理器来处理解析过程中的事件。可以创建一个继承自`DefaultHandler`类的自定义解析器,并重写`startElement`、`endElement`和`characters`等方法来处理开始节点、结束节点和节点内容等事件。 3. 解析XML:通过调用`xmlReader.parse()`方法解析XML文档。可以传递XML文档的输入流或文件路径作为参数。解析过程中,SAX解析器会将读取到的XML解析成事件,并传递给注册的自定义解析器进行处理。 以下是一个使用SAX解析解析XML的示例代码: ```java public class SaxReader { public static XMLReader getInstance() throws Exception { SAXParserFactory factory = SAXParserFactory.newInstance(); SAXParser saxParser = factory.newSAXParser(); XMLReader xmlReader = saxParser.getXMLReader(); return xmlReader; } public static void main(String\[\] args) throws Exception { XMLReader xmlReader = getInstance(); MyHandler myHandler = new MyHandler(); xmlReader.setContentHandler(myHandler); xmlReader.parse(SaxReader.class.getClassLoader().getResource("Book.xml").getFile()); List<Book> bookList = myHandler.getBookList(); System.out.println(bookList); } } ``` 在上述代码中,`MyHandler`是自定义的事件处理器,`xmlReader.setContentHandler(myHandler)`用于注册自定义解析器。`xmlReader.parse()`方法用于解析XML文档,其中`SaxReader.class.getClassLoader().getResource("Book.xml").getFile()`用于获取XML文件的路径。解析结果可以通过自定义解析器的方法获取。 希望以上信息对您有所帮助。 #### 引用[.reference_title] - *1* *2* [sax解析xml详解](https://blog.csdn.net/qq_41063182/article/details/103689891)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^insert_down28v1,239^v3^insert_chatgpt"}} ] [.reference_item] - *3* [SAX解析和生成XML文档](https://blog.csdn.net/weixin_32576389/article/details/114825517)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^insert_down28v1,239^v3^insert_chatgpt"}} ] [.reference_item] [ .reference_list ]

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值