Python采集某网站内容, m3u8内容下载

最新推荐文章于 2024-02-23 15:14:04 发布

魔王不会哭

最新推荐文章于 2024-02-23 15:14:04 发布

阅读量1.9w

点赞数 45

分类专栏：爬虫 python 文章标签： python pycharm

本文链接：https://blog.csdn.net/python56123/article/details/125020142

版权

本文介绍了如何使用Python进行m3u8内容的采集和下载，讲解了通过开发者工具分析数据来源，发送请求获取网页源代码，解析数据找到m3u8文件，再提取ts片段url，最后保存内容到本地的过程。此外，还探讨了Python在网站开发、爬虫、数据分析、自动化脚本和人工智能等领域的应用。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

前言

嗨喽，大家好呐！这里是魔王~

内置模块你安装好python环境就可以了

采集数据内容, 要知道我们想要内容是来自哪里

<开发者工具进行抓包分析>

正常情况, 一个完整的内容

m3u8内容会整个完整内容,分割成很多个小视频片段 <ts文件> 一个ts文件可能只有几秒钟的时间

所以我们得去找一个文件内容 <m3u8文件> 包含我们所有ts文件内容 <所有视频片段>

最好的搜索方式, 是根据ts文件url去搜索m3u8文件

请求获取网页源代码就可以得到m3u8文件 >>> 所有片段就得到了 >>> 合成为一个整体的内容

在这里插入图片描述

在这里插入图片描述

import time

import requests  # 数据请求模块
import re  # 正则表达式模块
import json
import pprint

for page in range(3, 29):
    print(f'正在采集第{
     page}