所需软件
1.chromedriver
2.Selenium
chromedriver的安装地址http://chromedriver.storage.googleapis.com/index.html
首先打开chrome浏览器右上角,点击设置
找到自己chrome浏览器的对应版本,点击关于Chrome,就可以查看到chrome浏览器对应的版本
例如,我的版本是108.0.5359.72,但里面没有找到相对应的,就可以使用尾号为71的,只i要前面的108.0.5359和所需要的一致即可,尽量使用版本号相差不多,否则可能驱动不起来。
然后根据自己所在系统来进行安装,windows用户选win332那个就可以。
接下来就是安装及配置环境变量,首先找到自己python环境所在位置,将chromedriver解压到对应环境位置,如果找不到python环境位置,就打开pycharm,按下面操作寻找
E:\pythonProject\venv\Scripts就是python环境所在位置,然后将chromedriver解压到当前文件夹即可。
找到chrome浏览器的属性,可以查到安装路径,复制好,为下面配置环境变量做准备
电脑下面会有搜索栏在里面输入环境变量,点击环境变量 ,会出现用户变量和系统变量,两种都可以配置环境变量(任选其一),PATH选择编辑,添加到里面就可以了。
此时,我们打开pycharm,对网站进行抓取,
from selenium import webdriver driver = webdriver.Chrome() url = 'https://www.baidu.com/' #你所要爬取的网站 driver.get(url) driver.maximize_window()
Selenium的用法请参考
selenium用法(最新版)_小迷糊团子的博客-CSDN博客_selenuim