python 爬取页面内的.ts文件并合并保存

最新推荐文章于 2024-06-03 17:18:57 发布

大蛇王

最新推荐文章于 2024-06-03 17:18:57 发布

阅读量8k

点赞数 7

分类专栏： python爬虫项目文章标签：爬虫 python

本文链接：https://blog.csdn.net/t8116189520/article/details/118341256

版权

一般网站的视频都是分段加载的，简单说就是把一个视频切成多个片段来加载，每个分段都会有不同的url地址。

这些url地址列表，会存放在一个.m3u8文件里。

首页打开待爬取的页面获取ts文件列表，按F12查看页面内容，ctlr+F 搜索 m3u8,找到这个地址。

（Ps:这个网站是个少儿不宜的网站，所以具体链接我就不贴出来了）

然后我们拿到这个地址，去读取里面内容。

import requests


url="https://xxx.sdhdbd1.com/52av/20210629/A%e5%9b%bd%e4%ba%a7%e8%87%aa%e6%8b%8d/%e8%ba%ab%e6%9d%90%e5%be%88%e6%98%af%e8%8b%97%e6%9d%a1%e9%98%b4%e6%af%9b%e5%a4%9a%e5%a4%9a%e6%8f%89%e5%a5%b6%e6%8e%b0%e7%a9%b4/SD/playlist.m3u8"
res=requests.get(url).text
print(res)

打印结果：

最低0.47元/天解锁文章

大蛇王

关注

7
点赞
踩
26

收藏

觉得还不错? 一键收藏
5
评论
python 爬取页面内的.ts文件并合并保存

一般网站的视频都是分段加载的，简单说就是把一个视频切成多个片段来加载，每个分段都会有不同的url地址。这些url地址列表，会存放在一个.m3u8文件里。首页打开待爬取的页面获取ts文件列表，按F12查看页面内容，ctlr+F 搜索 m3u8,找到这个地址。然后我们拿到这个地址，去读取里面内容。import requestsurl="https://xxx.sdhdbd1.com/52av/20210629/A%e5%9b%bd%e4%ba%a7%e8%87%aa%e6%8b%
复制链接

扫一扫