利用selenium 爬取网页数据

最新推荐文章于 2024-05-06 20:35:51 发布

蛋师傅

最新推荐文章于 2024-05-06 20:35:51 发布

阅读量5.1k

点赞数

分类专栏：爬虫 python 文章标签： selenium 爬虫 python

本文链接：https://blog.csdn.net/weixin_36842174/article/details/91056347

版权

9 篇文章 1 订阅

订阅专栏

9 篇文章 0 订阅

订阅专栏

有些网站的数据是加密过的，不能直接通过请求的方式获取。于是我们可以利用脚本测试工具selenium来控制浏览器从而爬取数据。

安装：

地址栏输入 chrome://settings/help 查看浏览器版本信息：

下载相对应的驱动然后放入浏览器的安装目录：

win：C:\Program Files (x86)\Google\Chrome\Application

Linux / mac：/usr/local/bin

若win下无法启动。可能原因是权限的问题。可以把该下载的可执行文件复制到代码同一目录即可。

from selenium import webdriver

browser = webdriver.Chrome()#初始化
browser.get(url)

browser.close()

以上代码即可打开一个浏览器

路径选择器：

browser.find_element_by_xpath("//div[@class='leftContent']")

获取网页源码：

get_attribute('innerHTML')

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

关注关注