selenium快速入门(全是干货)

为什么要使用Selemium

首先我们要知道,在python爬虫中我们使用selenium能干什么。首先我们在爬取网页的时候总是会遇到一些由JavaScript动态渲染出来的页面,使得我们普通的请求得不到想要的数据。而Selenium在爬虫中就是用来解决这种动态渲染的页面爬虫问题,它可以直接模拟浏览器的运行,因为对于浏览器来说,它是可以看见动态渲染的这一部分数据的,所以说我们可以直接通过selenium模拟浏览器拿到所需数据。

如何使用selenium

既然selenium要模拟浏览器的运行,那么我们就需要一个浏览器,一般来说,我们使用Chrome。因此先确保你的电脑正确的安装好了Chrome浏览器

导入selenium库

导完库之后,要确保已经导入成功了

pip install selenium
自动安装浏览器驱动

同时我们selenium要使用浏览器需要一个浏览器的驱动,这个驱动的版本要和浏览器对应,在这里我们可以直接自动安装这个驱动,需要用到ChromeDriverManager,直接导入。

from webdriver_manager.chrome import ChromeDriverManager

使用方法

ChromeDriverManager().install()

ChromeDriverManager()里面可以传入一个安装路径

driver_path = './'
ChromeDriverManager(path=driver_path).install()

至此我们在执行selenium程序的时候,它就会自动根据当前浏览器版本,在当前目录下面安装一个驱动。

初始化浏览器对象

在初始化浏览器对象的时候我们需要使用到webdriver和Service

首先导入

from selenium import webdriver
from selenium.webdriver.chrome.service import Service as ChromeService

然后将刚刚使用的加载浏览器驱动提供给Service,然后将带有驱动Service添加到浏览器对象中。

driver_path = './'
s = ChromeService(ChromeDriverManager(path=driver_path).install())
driver = webdriver.Chrome(service=s)

访问页面

对初始化的浏览器对象使用get方法,就可以直接访问页面了。

driver.get('https://so.csdn.net/')
print(driver.page_source)

至此,我们知道了如何使用selenium,并且访问了网站,并且使用**.page_source**拿到了网页数据。

  • 1
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

嚄825

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值