通过selenium库,python可以调用chrome打开指定网页并获取网页内容
1,安装selenium和配置chromedriver
- 安装selenium
C:\Users\cord> pip install selenium
- 配置chromedriver
下载路径: http://chromedriver.storage.googleapis.com/index.html
该下载什么版本根据浏览器版本以及附录的版本对照表下载
将下载的压缩包解压后得到的chromedriver.exe
复制到C:\Program Files (x86)\Google\Chrome\Application
路径下即可
2,调用chromedriver打开网页获取网页内容
from selenium import webdriver
#设置chromedriver
browser = webdriver.Chrome("C:\Program Files (x86)\Google\Chrome\Application\chromedriver.exe")
#设置超时时间
browser.set_page_load_timeout(10)
#打开网页
browser.get("http://www.cnblogs.com/cord/")
#打印网页内容
print(browser.page_source)
print("--------------------------------------------------------------------------------")
browser.get("https://www.baidu.com")
print(browser.page_source)
附录:
chromedriver版本 | 支持的Chrome版本 |
---|---|
v2.41 | v67-69 |
v2.40 | v66-68 |
v2.39 | v66-68 |
v2.38 | v65-67 |
v2.37 | v64-66 |
v2.36 | v63-65 |
v2.35 | v62-64 |
v2.34 | v61-63 |
v2.33 | v60-62 |
v2.32 | v59-61 |
v2.31 | v58-60 |
v2.30 | v58-60 |
v2.29 | v56-58 |
v2.28 | v55-57 |
v2.27 | v54-56 |
v2.26 | v53-55 |
v2.25 | v53-55 |
v2.24 | v52-54 |
v2.23 | v51-53 |
v2.22 | v49-52 |
v2.21 | v46-50 |
v2.20 | v43-48 |
v2.19 | v43-47 |
v2.18 | v43-46 |
v2.17 | v42-43 |
v2.13 | v42-45 |
v2.15 | v40-43 |
v2.14 | v39-42 |
v2.13 | v38-41 |
v2.12 | v36-40 |
v2.11 | v36-40 |
v2.10 | v33-36 |
v2.9 | v31-34 |
v2.8 | v30-33 |
v2.7 | v30-33 |
v2.6 | v29-32 |
v2.5 | v29-32 |
v2.4 | v29-32 |
参考链接:
https://www.jianshu.com/p/4b84a7d7e567
https://www.cnblogs.com/eternal1025/p/8880245.html