在爬取的过程中可能会遇到在浏览器中的xpath插件中输入抽取规则后能相应的提取想要的内容,但是将这个xpath提取规则放入代码中却无法提取到内容的情况,这是可以留意下以下是否在xpath的提取规则中包含tbody标签。
要注意一下,这里的主要问题是tbody标签的问题,网页返回本身是没有这个标签(还是得仔细看),是浏览器规范html元素中加上的,所以xpath路径中使用tbody标签就返回空了。
将代码中tbody标签去掉就能解决问题。
在爬取的过程中可能会遇到在浏览器中的xpath插件中输入抽取规则后能相应的提取想要的内容,但是将这个xpath提取规则放入代码中却无法提取到内容的情况,这是可以留意下以下是否在xpath的提取规则中包含tbody标签。
要注意一下,这里的主要问题是tbody标签的问题,网页返回本身是没有这个标签(还是得仔细看),是浏览器规范html元素中加上的,所以xpath路径中使用tbody标签就返回空了。
将代码中tbody标签去掉就能解决问题。