- 博客(1)
- 收藏
- 关注
原创 Python爬虫:xpath,cookie都正确仍然无法爬取需要的内容解决方法之一
经过很多次尝试以及仔细观察所爬取的html代码内容,我发现有一个标签里含有的css代码:style = display:none ,这行代码可以把这个标签里面的内容隐藏。展开这个标签里面的内容,很可能就是我们所需要的真实的页面a标签里面的url地址。注意,这里说了一般,有些网站的反爬措施很高级,甚至会封掉你的ip。看这篇文章的猿猿们肯定有了一定的python-xpath爬虫基础了,后面对li_tree的处理以及延伸获取所需要的页面内容我在这就不介绍啦!这样我们就得到了正确的li_tree。
2022-12-23 16:33:45 2206 3
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人