半夜1点,中秋节,在家还要想着这货!!
之前用的是火狐插件
https://blog.csdn.net/haoyuexihuai/article/details/81045870
问题是分析的项目返回的是json格式,火狐会自带美化功能,输出的网页源码是美化过的带有html标签的文本,并不能直接解析,也不方便解析。于是有重新安装了谷歌的插件。
插件下载
selenium安装:pip install selenium即可自动安装selenium
chromedriver下载:http://npm.taobao.org/mirrors/chromedriver/
我的谷歌浏览器版本为67,chromedriver2.40的版本下面notes.txt中会有介绍可以适用的谷歌版本。
几个环境变量
1.全局path下增加chrome的路径:C:\Users\S2-01\AppData\Local\Google\Chrome\Application ,(我放在了当前用户path下面一样的适用)
2.下载解压后,将chromedriver.exe 发到Python的安装目录的Scripts文件夹下,例如
python版本:D:\python\Scripts 。
Anaconda3版本: D:\Program Files\Anaconda3\Scripts
然后再将Python的安装目录添加到系统环境变量的Path下面。
3使用
from selenium import webdriver
option = webdriver.ChromeOptions()
option.add_argument("headless")
driver = webdriver.Chrome(chrome_options=option)
driver.get("https://www.baidu.com")