【python网络数据采集】selenium库基本配置及使用方法

selenium库基本配置及使用方法

Selenium(http://www.seleniumhq.org/)是一个强大的网络数据采集工具,其最初是为网站自动化测试而开发的。近几年,它还被广泛用于获取精确的网站快照,因为它们可以直接运行在浏览器上。
Selenium可以让浏览器自动加载页面,获取需要的数据,甚至页面截屏,或者判断网站上某些动作是否发生。

一、selenium库安装

可以从 PyPI 网站(https://pypi.python.org/simple/selenium/)下载 Selenium 库。
也可以用第三方管理器(像 pip)用命令行安装。

pip install selenium

二、下载浏览器驱动

Selenium 自己不带浏览器,需要与第三方浏览器结合在一起使用

这里以windows系统谷歌浏览器为例,下载对应版本的驱动

2.1 查看浏览器版本

(1)进入浏览器设置:
在这里插入图片描述
(2)进入关于Chrome
chrome://settings/help
在这里插入图片描述
(3)查看版本号:
这里是版本 102.0.5005.115(正式版本) (64 位)
在这里插入图片描述

2.2下载对于驱动

(1)找到对应版本驱动:
前三级版本号相同即可。
在这里插入图片描述
(2)下载对应系统驱动:
windows只有32位版本,不影响使用
在这里插入图片描述
(3)解压驱动到文件目录:
驱动文件可以放到python文件运行目录或者在运行是指定路径
在这里插入图片描述

三、运行Demo

驱动在当前目录下时:

from selenium import webdriver
driver = webdriver.Chrome()
url =  r'http://www.baidu.com'
driver.get(url)
driver.quit()

指定驱动路径:driverPATH

from selenium import webdriver
from selenium.webdriver.chrome.service import Service

driverPATH = r'E:\pythonWS\selenium\chromedriver.exe'
url =  r'http://www.baidu.com'
s = Service(driverPATH)
driver = webdriver.Chrome(service=s)

driver.get(url)
driver.quit()
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

BkbK-

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值