通过selenium库,python可以调用chrome打开指定网页并获取网页内容或者模拟登陆获取网页内容
1,安装selenium和配置chromedriver
安装selenium
C:\Users\cord> pip install selenium
配置chromedriver
该下载什么版本根据浏览器版本以及附录的版本对照表下载
将下载的压缩包解压后得到的chromedriver.exe复制到C:\Program Files (x86)\Google\Chrome\Application路径下即可
2,调用chromedriver打开网页获取网页内容
from selenium import webdriver
#设置chromedriver
browser = webdriver.Chrome("C:\Program Files (x86)\Google\Chrome\Application\chromedriver.exe")
#设置超时时间
browser.set_page_load_timeout(10)
#打开网页
browser.get("http://www.cnblogs.com/cord/")
#打印网页内容
print(browser.page_source)
print("--------------------------------------------------------------------------------")
browser.get("https://www.baidu.com")
print(browser.page_source)
3,模拟登陆百度云
from time import sleep
from selenium import webdriver
browser = webdriver.Chrome("C:\Program Files (x86)\Google\Chrome\Application\chromedriver.exe")
sleep(0.5)
browser.get("https://pan.baidu.com/")
sleep(2) #等待页面加载
browser.find_element_by_xpath('//*[@id="TANGRAM__PSP_4__footerULoginBtn"]').click() #选择账号密码登录
sleep(2)
browser.find_element_by_name("userName").send_keys("1142903706@qq.com") #输入账户密码
browser.find_element_by_name("password").send_keys("1142903706")
browser.find_element_by_xpath('//*[@id="TANGRAM__PSP_4__submit"]').click() #登录
sleep(1)
#退出
browser.close()
browser.quit()
附录(webdriver版本兼容列表)
chromedriver版本
支持的Chrome版本
v2.46
v71-73
v2.45
v70-72
v2.44
v69-71
v2.43
v69-71
v2.42
v68-70
v2.41
v67-69
v2.40
v66-68
v2.39
v66-68
v2.38
v65-67
v2.37
v64-66
v2.36
v63-65
v2.35
v62-64
v2.34
v61-63
v2.33
v60-62
v2.32
v59-61
v2.31
v58-60
v2.30
v58-60
v2.29
v56-58
v2.28
v55-57
v2.27
v54-56
v2.26
v53-55
v2.25
v53-55
v2.24
v52-54
v2.23
v51-53
v2.22
v49-52
v2.21
v46-50
v2.20
v43-48
v2.19
v43-47
v2.18
v43-46
v2.17
v42-43
v2.13
v42-45
v2.15
v40-43
v2.14
v39-42
v2.13
v38-41
v2.12
v36-40
v2.11
v36-40
v2.10
v33-36
v2.9
v31-34
v2.8
v30-33
v2.7
v30-33
v2.6
v29-32
v2.5
v29-32
v2.4
v29-32
参考链接: