selenium 基础语法
=============
一、 环境配置
=======
1、 安装环境
=======
安装 selenium 第三方库
pip install selenium
下载浏览器驱动:
-
Firefox浏览器驱动: geckodriver
-
Chrome浏览器驱动: chromedriver , taobao备用地址
-
IE浏览器驱动: IEDriverServer
-
Edge浏览器驱动: MicrosoftWebDriver
-
Opera浏览器驱动: operadriver
-
PhantomJS浏览器驱动: phantomjs
需要把这些浏览器驱动放入 Python 应用目录里面的 Script 文件夹里面
干货主要有:
======
① 200 多本 Python 电子书(和经典的书籍)应该有
② Python标准库资料(最全中文版)
③ 项目源码(四五十个有趣且可靠的练手项目及源码)
④ Python基础入门、爬虫、网络开发、大数据分析方面的视频(适合小白学习)
⑤ Python学习路线图(告别不入流的学习)
Python学习交流Q群101677771
2、 配置参数
=======
每次当selenium启动chrome浏览器的时候,chrome浏览器很干净,没有插件、没有收藏、没有历史记录,这是因为selenium在启动chrome时为了保证最快的运行效率,启动了一个裸浏览器,这就是为什么需要配置参数的原因,但是有些时候我们需要的不仅是一个裸浏览器
selenium启动配置参数接收是ChromeOptions类,创建方式如下 :
from selenium import webdriver
option = webdriver.ChromeOptions()
driver = webdriver.Chrome(chrome_options=option)
创建了ChromeOptions类之后就是添加参数,添加参数有几个特定的方法,分别对应添加不同类型的配置项目
from selenium import webdriver
option = webdriver.ChromeOptions()
添加启动参数
option.add_argument()
添加扩展应用
option.add_extension()
option.add_encoded_extension()
添加实验性质的设置参数
option.add_experimental_option()
设置调试器地址
option.debugger_address()
常用配置参数:
from selenium import webdriver
option = webdriver.ChromeOptions()
添加UA
options.add_argument(‘user-agent=“MQQBrowser/26 Mozilla/5.0 (Linux; U; Android 2.3.7; zh-cn; MB200 Build/GRJ22; CyanogenMod-7) AppleWebKit/533.1 (KHTML, like Gecko) Version/4.0 Mobile Safari/533.1”’)
指定浏览器分辨率
options.add_argument(‘window-size=1920x3000’)
谷歌文档提到需要加上这个属性来规避bug
chrome_options.add_argument(‘–disable-gpu’)
隐藏滚动条, 应对一些特殊页面
options.add_argument(‘–hide-scrollbars’)
不加载图片, 提升速度
options.add_argument(‘blink-settings=imagesEnabled=false’)
浏览器不提供可视化页面. linux下如果系统不支持可视化不加这条会启动失败
options.add_argument(‘–headless’)
以最高权限运行
options.add_argument(‘–no-sandbox’)
手动指定使用的浏览器位置
options.binary_location = r"C:\Program Files (x86)\Google\Chrome\Application\chrome.exe"
#添加crx插件
option.add_extension(‘d:\crx\AdBlock_v2.17.crx’)
禁用JavaScript
option.add_argument(“–disable-javascript”)
设置开发者模式启动,该模式下webdriver属性为正常值
options