有小伙伴在爬取内容的适合发现,咦?明明复制过来的xpath路径,怎么会错呢!
废话不多说,直接给出解决3个方案
- 有的浏览器会自动生成table或者tbody标签,检查一下自己的路径有没有这些标签,有的话删除就可以
- 不要使用绝对路径,使用相对路径!
- 如果返回还是空,说明页面源代码不是这个标签属性跟开发者看到的标签属性不一样了!!
这是开发者工具看到的图书图片 标签及内容
这是源代码对应的图书图片 标签及内容所以路径不应该写img/@src,要以源代码路径为为准 ,改成img/@data-lazy-img!!!
分享到此结束,下课~
我是一名python爬虫小白,一直在路上从未停止。