在搬砖的土豆-CSDN博客

原创 Python爬虫：xpath，cookie都正确仍然无法爬取需要的内容解决方法之一

经过很多次尝试以及仔细观察所爬取的html代码内容，我发现有一个标签里含有的css代码：style = display:none ，这行代码可以把这个标签里面的内容隐藏。展开这个标签里面的内容，很可能就是我们所需要的真实的页面a标签里面的url地址。注意，这里说了一般，有些网站的反爬措施很高级，甚至会封掉你的ip。看这篇文章的猿猿们肯定有了一定的python-xpath爬虫基础了，后面对li_tree的处理以及延伸获取所需要的页面内容我在这就不介绍啦！这样我们就得到了正确的li_tree。

2022-12-23 16:33:45 2452 3

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人