关于selenium和requests获取超链接时的一点区别！！！！！

最新推荐文章于 2024-07-06 20:31:32 发布

westwet

最新推荐文章于 2024-07-06 20:31:32 发布

阅读量1.2k

点赞数 1

分类专栏： python爬虫文章标签： python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_41868756/article/details/97791530

版权

python爬虫专栏收录该内容

0 篇文章 0 订阅

订阅专栏

今天在爬取网页超链接时使用requests先进行爬取结果发现无法爬取到网页中的超链接，对网页的源码进行查看时发现我所要爬取的超链接是属于ul路径下，上网查了一下。

 ul 标签定义无序列表。

而现在的网页用的大多是ajax技术，网页中的列表是属于异步传输，需要下拉才可以加载出来。所以我又换了一个使用selenium来爬取，爬取时我又发现了一点问题
在selenium中是使用get_attribute(‘href’) 方法来获取a下面的href内容

[i.get_attribute('href') for i in driver.find_elements_by_tag_name('a')]

而使用requests是使用get(‘href’)来获取链接内容

[i.get('href') for i in te.find_all('a',{'href':True})]

这里的错误让我耗费了半个多小时！！哎
因此这里得注意一下对于爬取动态ajax网页最好还是使用selenium，获取超链接时注意方法的调用

关注

1
点赞
踩
3

收藏

觉得还不错? 一键收藏
1
评论
关于selenium和requests获取超链接时的一点区别！！！！！

今天在爬取网页超链接时使用requests先进行爬取结果发现无法爬取到网页中的超链接，对网页的源码进行查看时发现我所要爬取的超链接是属于ul路径下，上网查了一下。 ul 标签定义无序列表。而现在的网页用的大多是ajax技术，网页中的列表是属于异步传输，需要下拉才可以加载出来。所以我又换了一个使用selenium来爬取，爬取时我又发现了一点问题在selenium中是使用get_attribu...
复制链接

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。