- 博客(4)
- 收藏
- 关注
原创 Python爬取加密的m3u8视频文件
在确定电影资源的src_url时,我使用的是F12中的element来定位视频资源,使用element的原因是因为element的数据比较全,同时可以通过鼠标精准定位视频所在的具体标签。服务端返回的https的链接就是ts的资源链接,#EXT-X-KEY:METHOD=AES-128,URI="enc.key"说明ts视频加密,加密方式是AES-128,密钥是enc.key。如果没有加密就直接保存。2.从起始url返回信息中提取m3u8的url,同时对提取出的url做相应的处理,让其和期望的url相同。
2023-12-19 18:09:26
1518
1
原创 python 如何在js中提取url list
查看 new_match二维数组中的元素\\x22:\\x22https:\\\\\\/\\\\\\/t7.baidu.com\\\\\\/it\\\\\\/u=1819248061,230866778&fm=193&f=GIF\\x22,\\,这里的url信息和我们想要的比较接近了。但是除了t7.baidu.com域名的url外,还有其他我们不需要的url,如www.vcg.com域名的url信息。首先,我打印了下服务端返回的消息内容,发现这次图片的url不在html的标签中,而是隐藏在js的内容中。
2023-12-06 17:07:37
955
1
原创 python 2.7上执行 scrapy 1.8 框架的脚本遇到的错误
初步断定该问题应该不是无service_identity导致的,猜测该问题可能和我本机的service_identity的版本不兼容有关或者有可能和service_identity无关。后继续查询资料,才知该问题确实和service_identity的版本有关,通过命令“pip install service_identity --force --upgrade”对service_identity来强制升级解决了该问题。scrapy和我本机的service_identity的不兼容有关。
2023-11-24 11:42:33
439
2
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人