python爬取ts分段视频，以韩剧TV网站为例

重剑无锋1024

于 2024-12-03 20:01:37 发布

阅读量2.3k

点赞数 52

文章标签： python 音视频开发语言

本文链接：https://blog.csdn.net/xaing1314/article/details/144222115

版权

提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档

python爬取ts分段视频，以韩国TV网站为例

前言
- 一.本文展示如何用python代码爬取不可以直接下载的视频文件。其中韩剧TV中的视频是切片成ts的，一个个，所以我们要知道一系列的地址，下方为该网站截图。
- 二。在文件合并时，要注意文件命名的顺序安装如图所示的样式，字符宽度的输出，不可以1,2,3,4...这种，因为默认合并顺序会报错文件会以这种顺序合并：1，11，111...,2,22,222...达不到正确的合并顺序这一点尤为注意
一、download函数
- 下方函数的url替换成自己想要爬取视频的url。timeout的设置代表是给它多少时间完成，下载归为一个列表，下次再进行下载，此外我们开启了多线程下载。
二、将所有.ts视频合并成为一个.mp4格式的视频
- 因为我们是下载了多个.ts的视频
- 所以用循环合并多个视频并且改为.mp4格式。此外要注意文件命名的顺序安装如图所示的样式，字符宽度的输出，不可以1,2,3,4...这种，因为默认合并顺序会报错文件会以这种顺序合并：1，11，111...,2,22,222...达不到正确的合并顺序这一点尤为注意
三、将所有.ts没有下载到的再重新下载一下。循环遍历failure_list,直到其为空，确保所有视频下载成功。
四、完整代码演示
总结

前言

提示：这里可以添加本文要记录的大概内容：

一.本文展示如何用python代码爬取不可以直接下载的视频文件。其中韩剧TV中的视频是切片成ts的，一个个，所以我们要知道一系列的地址，下方为该网站截图。

二。在文件合并时，要注意文件命名的顺序安装如图所示的样式，字符宽度的输出，不可以1,2,3,4…这种，因为默认合并顺序会报错文件会以这种顺序合并：1，11，111…,2,22,222…达不到正确的合并顺序这一点尤为注意

在这里插入图片描述
假如我要爬取这个视频《娱乐天下》，那么我就这样定位，然后找到url

一、download函数

下方函数的url替换成自己想要爬取视频的url。timeout的设置代表是给它多少时间完成，下载归为一个列表，下次再进行下载，此外我们开启了多线程下载。

def download(num, flag=0):
    # https://*****/20200508/19312_c9d456ff/1000k/hls/output1.ts
    url = f'https://***************************************/output{
     num}.ts'
    print(url)
    r = requests.get(url, headers=headers, timeout=10)
    if r.status_code == 200:
        with open(path + "download\\" + str(f'{
     num:04d}.ts'), 'wb') as f:
            try:
                r.encoding = 'utf-8'
                print(f'正在下载第{
     num}个片段成功。')
                f.write(r.content)
                if flag == 1:
                    failure_list

最低0.47元/天解锁文章