–in-process-plugins
插件不启用单独进程
–disable-popup-blocking
禁用弹出拦截
–disable-plugins
禁用插件
–disable-images
禁用图像
–incognito
启动进入隐身模式
–enable-udd-profiles
启用账户切换菜单
–proxy-pac-url
使用pac代理 [via 1/2]
–lang=zh-CN
设置语言为简体中文
–disk-cache-dir
自定义缓存目录
–disk-cache-size
自定义缓存最大值(单位byte)
–media-cache-size
自定义多媒体缓存最大值(单位byte)
–bookmark-menu
在工具 栏增加一个书签按钮
–enable-sync
启用书签同步
### 3、 常用参数搭配
制作无头浏览器
第一种写法
from selenium import webdriver
from selenium.webdriver.chrome.options import Options
chrome_options = Options()
chrome_options.add_argument(‘–headless’)
chrome_options.add_argument(‘–disable-gpu’)
driver = webdriver.Chrome(chrome_options=chrome_options)
第二种写法
from selenium import webdriver
options = webdriver.ChromeOptions()
options.add_argument(‘–headless’)
options.add_argument(‘–disable-gpu’)
driver = webdriver.Chrome(chrome_options=options)
规避检测
门户网站检测如果是selenium请求的,有可能会拒绝访问。这也是一种反爬机制
实现规避检测
from selenium import webdriver
from selenium.webdriver import ChromeOptions
options = ChromeOptions()
options.add_experimental_option(‘excludeSwitcher’, [‘enable-automation’])
driver = webdriver.Chrome(options=options)
注意:这里只能使用 options 添加
如果有其他的模块要添加,注意要分开添加
### 4、 分浏览器启动
from selenium import webdriver
driver = webdriver.Firefox() # Firefox浏览器
driver = webdriver.Firefox(executable_path=“驱动路径”)
driver = webdriver.Chrome() # Chrome浏览器
driver = webdriver.Ie() # Internet Explorer浏览器
driver = webdriver.Edge() # Edge浏览器
driver = webdriver.Opera() # Opera浏览器
driver = webdriver.PhantomJS() # PhantomJS
### 二、 基本语法
### 1、 元素定位
元素定位语法
常用语法:
find_element_by_id()
find_element_by_name()
find_element_by_class_name()
find_element_by_tag_name()
find_element_by_link_text()
find_element_by_partial_link_text()
find_element_by_xpath()
find_element_by_css_selector()
在 element 变成 elements 时,返回符合条件的所有元素