Selenium:浏览器爬虫使用详解(一)

本文介绍了Selenium的用途,它用于模拟浏览器操作,不同于常规爬虫的请求方式。文章详细讲解了Selenium的安装过程,包括使用国内源加速、解决依赖冲突,并提到了安装浏览器驱动的步骤,如针对不同浏览器版本下载对应驱动。此外,还指导了如何设置环境变量及测试安装是否成功。最后,给出了一个简单的Selenium Python代码示例,展示如何启动浏览器、访问网页、获取页面标题并关闭浏览器。
摘要由CSDN通过智能技术生成

简介:

直接网上搜Selenium的就能知道了。简而言之Selenium通过模拟人对浏览器操作实现浏览器的自动操作。它与其他爬虫的不同点是,其他爬虫是模拟浏览器发出请求,而Selenium是模拟人对浏览器进行操作。

实现Selenium需要的东西

1、安装Selenium

直接使用pip命令安装,建议加上国内源快一些。

pip install selenium -i https://pypi.tuna.tsinghua.edu.cn/simple

安装的时候可能会遇到很多很操蛋的问题(到时候百度解决吧)

比如:

selenium 4.3.0 requires urllib3[secure,socks]~=1.26, but you have urllib3 1.24.3 which is incompatible

requests 2.21.0 requires urllib3<1.25,>=1.21.1, but you have urllib3 1.26.10 which is incompatible

然后我安装的版本

requests==2.28.1

urllib3==1.26.10

selenium==4.3.0

2、安装浏览器驱动

查看你的浏览器版本,在网上查找你浏览器版本的驱动然后下载。

以谷歌浏览器为例:

网上找到对应浏览器驱动的下载地址:

谷歌: http://chromedriver.storage.googleapis.com/index.html

注意:没有找到一模一样的可以选择接近的版本,没有64位的可以选择32位的,64位兼容32位。

 

将驱动解压到一个文件夹里,然后将存放路径添加到系统环境变量的Path变量中。

将谷歌浏览器的运行启动软件路径也添加到系统环境变量的Path变量中。

建议修改完环境变量后重启电脑,不然有可能设置了没生效。

 安装测试

from selenium import webdriver
import time

# 创建浏览器驱动对象,Chrome()代表是谷歌浏览器的驱动
driver = webdriver.Chrome()
# 访问网址
driver.get('https://blog.csdn.net/m0_72501048?type=blog')
#程序暂停10秒
time.sleep(10)
#输出页面title
print(driver.title)
# 关闭当前网页
driver.close()
# 关闭浏览器驱动对象
driver.quit()

评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

快乐小土狗

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值