有些网页右键查看网页源代码,里面没有要查找的数据,这是为什么呢?答案是:页面是由JS动态生成出来的。
但是在审查元素中Elements中是有的。
解决方案是 python 有一个第三方库 Selenium 可以模拟浏览器
第一步 安装 Selenium
在 cmd 中 打开python的Scripts目录 。输入python 回车
输入 : pip install selenium
安装最新版Selenium
第二步 安装浏览器驱动(本人使用的Chrome)
网上找到与浏览器对应版本的驱动后(谷歌为 chromedriver ),下载解压 放到浏览器的安装目录下 (chrome://version 命令查看路径)
第三步 代码部分
chromedriver = "C:\Program Files (x86)\Google\Chrome\Application\chromedriver.exe" #驱动路径
driver = webdriver.Chrome(chromedriver) #启动浏览器
driver.get("url") #打开网址
#驱动路径
driver = webdriver.Chrome(chromedriver) #启动浏览器
driver.get("url") #打开网址
driver.page_source #加载完成后返回网页源代码,但是JS动态生成的页面。webdriver并不知道何时加载完毕 所以需要用到 time.sleep() 函数延时
使用time函数 需要import time 导入