爬虫日记01：爬取m3u8格式视频和解密

新手_six

已于 2022-01-20 20:08:01 修改

阅读量1w

点赞数 5

文章标签： python 爬虫音视频

于 2022-01-13 05:14:58 首次发布

本文链接：https://blog.csdn.net/Six23/article/details/122466060

版权

本文记录了一次使用Python爬虫爬取并解密m3u8格式视频的过程。首先获取主页面的iframe，从中提取m3u8文件，接着下载第一层和第二层m3u8，解密AES加密的视频片段，并最终合并成MP4文件。过程中涉及Python相关模块的使用及视频解密技术。

摘要由CSDN通过智能技术生成

开发环境

·python3.10

·pycharm

相关模块的应用

import requests
from bs4 import BeautifulSoup
import asyncio
import aiohttp
import aiofiles

确定目标需求

对某盗版网站进行浴血黑帮视频的爬取

嘿嘿

进行网页数据分析，找寻我们所需的数据来源

由于该视频存在2个m3u8

所以我们得先得到第一层的m3u8文件下载地址，再从第一层m3u8文件中得到第二层m3u8文件的下载地址。当然，你也可以直接在第二个m3u8里获取它的url进行视频下载。

整体思路

1.拿到主页面的页面源代码，找到iframe

2.从iframe的页面源代码中拿到m3u8文件

3.下载第一层m3u8文件，----》下载第二层m3u8文件(得到视频的全部ts路径)

4.下载视频

5.下载秘钥进行解密操作

6.合并所有ts文件为一个mp4文件（利用各种办法：工具或者代码都行）

代码的实现

1.对浴血黑帮视频的下载

import requests
from bs4 import BeautifulSoup
import asyncio
import aiohttp
import aiofiles

# 获取iframe_src
def get_iframe_src(url):
    res = requests.get(url) # 获取页面源代码
    main_pa

最低0.47元/天解锁文章

新手_six

关注

5
点赞
踩
42

收藏

觉得还不错? 一键收藏
打赏
2
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫