使用Selenium爬虫进阶

最新推荐文章于 2023-09-22 13:40:31 发布

君的名字

最新推荐文章于 2023-09-22 13:40:31 发布

阅读量476

点赞数 1

分类专栏：【爬虫】

本文链接：https://blog.csdn.net/chichoxian/article/details/103284349

版权

5 篇文章 0 订阅

订阅专栏

selenium 是一个自动化的web 浏览器的测试工具，我们可以用selenium 来模拟人对浏览器（browser）的操作，我们也可以使用这个工具来做爬虫。

具体的情况可以参考相关的官网： https://selenium.dev

我用python 来做开发，因此这里我们下载相关的文件，用这个网站 https://selenium.dev/downloads/

安装Selenium

安装 selenium 3.141.0 ，具体的方法你也可以参考官网 https://pypi.org/project/selenium/

方法就是

pip install selenium

使用我们的Selenium 我们需要选择对应浏览器相关的驱动，我用的是chrome,
现在它支持的是

浏览器	链接
FireFox	https://github.com/mozilla/geckodriver/releases
Chrome	https://sites.google.com/a/chromium.org/chromedriver/downloads
Edge	https://developer.microsoft.com/en-us/microsoft-edge/tools/webdriver/
Safari	https://webkit.org/blog/6900/webdriver-support-in-safari-10/

我们只需要根据我们自己想要的浏览器，来下载相关的驱动，我用的是chrome,因此我到对应的link 去下载我的驱动： https://sites.google.com/a/chromium.org/chromedriver/downloads

它给出的可以选择的浏览器驱动有78,77,79 这三个可以选择

根据它的官网，你可以看到：
在这里插入图片描述

所以具体要选择哪个，要看一看你的浏览器的是哪个版本，怎么看，我们先点击我chrome右上角的那三个小的点点。

选择chrome 的Help ，之后可以看见 about chrome,点击进去就可以看到了，或者直接输入 chrome://settings/help，也可以看到

在这里插入图片描述

上图就是我的浏览器的型号，是 Version 77.0.3865.90 (Official Build) (64-bit)

如下图所示：
在这里插入图片描述

以Firefox 为例子，我们来看一下

from selenium import webdriver

browser = webdriver.Firefox()
browser.get('http://seleniumhq.org/')

chrome 的例子

from selenium import webdriver
driver = webdriver.Chrome()
driver.get('https://www.google.cz')

来吧～～～
在这里插入图片描述

关注