前言
以前都用python scrapy(各种ip代理池啥的非常麻烦)爬虫,由于现在的反爬虫机制太强大,经常会被限制,实际运行中得不到良好的作用,因此采用自动化以满足需求。
一、环境和前期准备
- pip install selenium
- chromedriver(与谷歌浏览器版本对应的驱动,下载后放到与python.exe同目录下,anoconda下的虚拟环境均可)
chromedriver下载地址
二、代码示例
from selenium import webdriver
url = "https://www.baidu.com/"
chrome_options = webdriver.ChromeOptions(