昨天想爬取一些网站的视频,不知道该怎么入手,查过资料后发现,网站的加载模式是 用 m3u8视频 通过key 加密,读取.ts文件实现视频播放功能。
解释有点少,大家自行百度查询。
过程分析:
一般浏览器会先请求后缀名为.m3u8的文件,文件中包含 .ts 的文件路径 (是部分路径)
但实际上有些网站的ts文件是用AES-128加密过的
#EXTM3U
#EXT-X-VERSION:1
#EXT-X-TARGETDURATION:10
#EXT-X-MEDIA-SEQUENCE:0
#EXTINF:3,
1-4.ts
#EXTINF:8,
1-6.ts
#EXTINF:8,
1-8.ts
#EXTINF:8,
1-10.ts
#EXTINF:8,
1-12.ts
#EXTINF:8,
1-14.ts
#EXTINF:8,
1-16.ts
#EXTINF:9,
1-24.ts
#EXTINF:3,
1-26.ts
#EXT-X-ENDLIST
如果是加密过的
#EXTM3U
#EXT-X-VERSION:3
#EXT-X-TARGETDURATION:2
#EXT-X-MEDIA-SEQUENCE:0
#EXT-X-KEY:METHOD=AES-128,URI=“key.key” #key密钥文件
这时需要去请求URL 的key.key 文件
得到key 文件之后 读取找到key 对应的文本, 再python中使用 AES.new(key, AES.MODE_CBC, key)
在from Crypto.Cipher import AES 模块下
遍历所有.ts路径然后请求获取数据解码然后写入本地
最后批处理生成.mp4文件 。
整个思路是这样的。
代码稍后放入
借鉴大神:
https://blog.csdn.net/skydxd/article/details/83150122
不懂的可以去看看