python3的静态检查文件_python3+selenium获取页面加载的所有静态资源文件链接操作...

最新推荐文章于 2021-01-24 09:46:56 发布

weixin_39748773

最新推荐文章于 2021-01-24 09:46:56 发布

阅读量77

点赞数

文章标签： python3的静态检查文件

软件版本：Zg2免费资源网

python 3.7.2Zg2免费资源网

selenium 3.141.0Zg2免费资源网

pycharm 2018.3.5Zg2免费资源网

具体实现流程如下，废话不多说，直接上代码：Zg2免费资源网

from selenium import webdriver

from selenium.webdriver.chrome.options import Options

from selenium.webdriver.common.desired_capabilities import DesiredCapabilities

d = DesiredCapabilities.CHROME

chrome_options = Options()

#使用无头浏览器

chrome_options.add_argument('--headless')

chrome_options.add_argument('--user-agent=Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/71.0.3578.98 Safari/537.36')

#浏览器启动默认最大化

chrome_options.add_argument("--start-maximized");

#该处替换自己的chrome驱动地址

browser = webdriver.Chrome("D://googleDever//chromedriver.exe",chrome_options=chrome_options,desired_capabilities=d)

browser.set_page_load_timeout(150)

browser.get("https://www.xxx.com")

#静态资源链接存储集合

urls = []

#获取静态资源有效链接

for log in browser.get_log('performance'):

if 'message' not in log:

continue

log_entry = json.loads(log['message'])

try:

#该处过滤了data:开头的base64编码引用和document页面链接

if "data:" not in log_entry['message']['params']['request']['url'] and 'Document' not in log_entry['message']['params']['type']:

urls.append(log_entry['message']['params']['request']['url'])

except Exception as e:

pass

print(urls)

打印结果为页面渲染时加载的静态资源文件链接：Zg2免费资源网

[http://www.xxx.com/aaa.js,http://www.xxx.com/CSS.css]Zg2免费资源网

以上代码为selenium获取页面加载过程中预加载的各类静态资源文件链接，使用该功能获取到链接后，使用其他插件进行可对资源进行下载！Zg2免费资源网

补充知识：在idea 中python import sys，import requests 报错Zg2免费资源网

File->Project StructureZg2免费资源网

project -> sdk -> new -> okZg2免费资源网

设置编译参数(主要是设置和检查Python JDK是否正确)Zg2免费资源网

Zg2免费资源网

weixin_39748773

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
python3的静态检查文件_python3+selenium获取页面加载的所有静态资源文件链接操作...

软件版本：Zg2免费资源网python 3.7.2Zg2免费资源网selenium 3.141.0Zg2免费资源网pycharm 2018.3.5Zg2免费资源网具体实现流程如下，废话不多说，直接上代码：Zg2免费资源网from selenium import webdriverfrom selenium.webdriver.chrome.options import Optionsfrom se...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。