关于xpath获取数据为空的原因
最近在自学爬虫的过程中,使用xpath获取数据,可总是返回空列表,发现了一个问题:
我们在浏览器中的开发者工具中根据标签所写的xpath路径,没有出错的情况下返回列表为空,从网上发现了两种情况:
- 路径中含有tbody标签,这个很简单,只用将tbody删掉即可
- 所爬取的数据被注释,这个解决也比较容易,replace注释的符号。
- 也就是我刚发现的,我所想要的属性名为浏览器修改,导致返回为空,如下图:(开发者工具中显示的属性名为src)
但是如果我在xpath路径中吸入//a/@src返回的却是空列表 - 解决方法:查看页面源代码,寻找目的链接,核实一些关键信息,就比如属性名,如下图
故将xpath中的属性名修改为lz_src即可。