HtmlCleaner无法通过XPath获取到数据
用法
String content=获取到的页面内容
HtmlCleaner htmlCleaner=new HtmlCleaner();
TagNode rootNode=htmlCleaner.clean(content);
Object[] objects=rootNode.evaluateXPath("");
出现的问题
objects为空,无法通过XPath获取到数据
可能的原因
- 不同浏览器获取到的XPath不同
- XPath路径中有tbody标签
- Xpath路径有html,示例:
Xpath: /html/body/div[2]
- 希望获取的数据是动态加载的
解决措施
- 尝试更换浏览器
- 删除tbody标签,这是因为网页返回本身是没有这个标签,是浏览器规范html元素中加上的
- 删除Xpath路径中的html
- 参考链接