1、查看自己谷歌浏览器的版本号
2、安装chromedriver到python安装包的scripts文件夹里并解压
cmd>>chromedriver,显示如下信息则安装成功http://chromedriver.storage.googleapis.com/index.htmlhttp://chromedriver.storage.googleapis.com/index.html
3、selenium库的安装
cmd>>pip install selenium
安装完毕后输入以下代码进行测试:
from selenium import webdriver
browser=webdriver.Chrome()
browser.get("https://www.baidu.com/")
运行结果: 窗口中会显示:chrome正受到自动测试软件的控制
4、selenium库的使用
1)访问及关闭网页、浏览器窗口最大化
2)查找元素模拟鼠标和键盘操作
3)获取网页真正的源代码
selenium库模拟操作代码练习:
from selenium import webdriver
import time
browser=webdriver.Chrome()
browser.get("https://www.baidu.com/")
browser.maximize_window()#模拟浏览器窗口最大化
#browser.find_element_by_xpath('//*[@id="kw"]').clear()#清除搜索框的默认文字,百度首页没有默认文字所以隐藏代码
browser.find_element_by_css_selector('#kw').send_keys('China')#定位到搜索框
browser.find_element_by_xpath('//*[@id="su"]').click()#模拟单击百度一下
time.sleep(3)#防止加载太慢,导致获取不到新网页的源代码
data=browser.page_source
print(data)
#browser.quit()#关闭模拟浏览器
运行结果:
代码练习:无界面浏览器设置
from selenium import webdriver#引入selenium库
chrome_options=webdriver.ChromeOptions()#赋值操作
chrome_options.add_argument('--headless')#chrome操作引入参数'--headless'不弹出窗口
browser=webdriver.Chrome(options=chrome_options)#声明模拟浏览器为谷歌,并执行chrome_options的操作
browser.get("https://finance.sina.com.cn/realstock/company/sh000001/nc.shtml")#访问网址
data=browser.page_source#将获取的网页源码赋值
print(data)#打印数据
运行结果: