有没有一种方法可以使用XMLStreamReader准确地收集xml标签的字节偏移?
我有一个很大的xml文件,需要随机访问.与其将整个内容写入数据库,我不希望使用XMLStreamReader在数据库中运行一次以收集重要标签的字节偏移量,然后可以使用RandomAccessFile稍后检索标签内容.
XMLStreamReader似乎没有跟踪字符偏移量的方法.相反,人们建议将XmlStreamReader附加到跟踪已读取多少字节的读取器(例如apache.commons.io提供的CountingInputStream).
例如:
CountingInputStream countingReader = new CountingInputStream(new FileInputStream(xmlFile)) ;
XMLStreamReader xmlStreamReader = xmlStreamFactory.createXMLStreamReader(countingReader, "UTF-8") ;
while (xmlStreamReader.hasNext()) {
int eventCode = xmlStreamReader.next();
switch (eventCode) {
case XMLStreamReader.END_ELEMENT :
System.out.println(xmlStreamReader.getLocalName() + " @" + countingReader.getByteCount()) ;
}
}
xmlStreamReader.close();
不幸的是,必须进行一些缓冲,因为上面的代码为几个标签打印出相同的字节偏移量.有没有一种更准确的跟踪xml文件中字节偏移的方法(理想情况下无需诉诸于放弃正确的xml解析)?