java xpath evaluate_java – XPath.evaluate性能在多个调用中减慢(荒谬)

最新推荐文章于 2021-03-07 02:24:24 发布

林常润

最新推荐文章于 2021-03-07 02:24:24 发布

阅读量404

点赞数

文章标签： java xpath evaluate

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_29079743/article/details/114097190

版权

我试图使用javax.xml.xpath包在具有多个命名空间的文档上运行XPath表达式，并且我有愚蠢的性能问题。

我的测试文件是从一个真实的生产实例中抽出来的。大约600k xml。该文档是一个相当复杂的Atom提要。

我知道我在做XPath可以做到没有。然而，在其他较差的平台上，同样的实施方式表现得更为荒谬。现在，重建我的系统不使用XPath超出了我能做的时间范围。

我的测试代码是这样的：

void testXPathPerformance()

{

DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();

factory.setNamespaceAware(true);

DocumentBuilder builder = factory.newDocumentBuilder();

Document doc = builder.parse(loadTestDocument());

XPathFactory xpf = XPathFactory.newInstance();

XPath xp = xpf.newXPath();

NamespaceContext names = loadTestNamespaces();

//there are 12 namespaces in names. In this example code, I'm using

//'samplens' instead of the actual namespaces that my application uses

//for simplicity. In my real code, the queries are different text, but

//precisely the same complexity.

xp.setNamespaceContext(names);

NodeList nodes = (NodeList) xp.evaluate("/atom:feed/atom:entry",

doc.getDocumentElement(), XPathConstants.NODESET);

for(int i=0;i

{

printTimestamp(1);

xp.evaluate("atom:id/text()", nodes.item(i));

printTimestamp(2);

xp.evaluate("samplens:fieldA/text()", nodes.item(i));

printTimestamp(3);

xp.evaluate("atom:author/atom:uri/text()", nodes.item(i));

printTimestamp(4);

xp.evaluate("samplens:fieldA/samplens:fieldB/&at;attrC", nodes.item(i));

printTimestamp(5);

//etc. My real example has 10 of these xp.evaluate lines

}

}

当我运行Nexus One时，(不是在调试器中，而是连接USB)，首次通过循环，每个xp.evaluate需要10ms到20ms的地方。在第15次循环之前，每个xp.evaluate需要从200ms到300ms。在循环结束(节点中有150个项目)，每个xp.evaluate需要大约500ms-600ms。

我试过使用xp.compile()。编译器都采取< 5ms。我已经完成了xp.reset()(没有区别)。我为每个评估完成了一个新的XPath对象(增加了大约4ms)。在执行过程中，内存使用情况似乎不会失去控制。我在JUnit测试用例中的单个线程上运行此操作，但不会创建活动或任何内容。我真的很困惑有人有什么想法还有什么尝试吗？谢谢！更新如果我向后运行for循环(for(int i = nodes.getLength() – 1; i> = 0; i–))，那么前几个节点需要500ms-600ms，最后一个节点快速运行10ms -20ms。所以，这似乎与调用次数无关，而是上下文靠近文档末尾的表达式比上下文靠近文档开头的表达式要长。

有人有什么想法可以做到这一点吗？

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
java xpath evaluate_java – XPath.evaluate性能在多个调用中减慢(荒谬)

我试图使用javax.xml.xpath包在具有多个命名空间的文档上运行XPath表达式，并且我有愚蠢的性能问题。我的测试文件是从一个真实的生产实例中抽出来的。大约600k xml。该文档是一个相当复杂的Atom提要。我知道我在做XPath可以做到没有。然而，在其他较差的平台上，同样的实施方式表现得更为荒谬。现在，重建我的系统不使用XPath超出了我能做的时间范围。我的测试代码是这样的：void ...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。