『python爬虫』21. 协程爬取一个视频需要的知识

文章介绍了视频网站通过分片加载减少流量成本的原理,阐述了视频抓取的重点在于找到M3U8文件来获取视频切片,并讲述了将TS文件合并成MP4的过程。虽然提供的代码已过期,但文章强调了爬虫抓取视频的基本思路。
摘要由CSDN通过智能技术生成


欢迎关注 『python爬虫』 专栏,持续更新中
欢迎关注 『python爬虫』 专栏,持续更新中

1. 一般的视频网站播放原理与抓取思路

  • 如果我们要看一部电影几个G的大小,视频网站需要支付几个G的流量费用。
    问题是,如果我们只看了几分钟就不想看了,切走,那么加载了几个G流量的视频网站是不是亏死了?

  • 实际上,视频网站进度条颜色有区别,一般会有一个预加载的进度条,这使得哪怕你突然断网视频也能播放几分钟,视频网站其实是几分钟几分钟的切片加载内容,而不是一次性把整个视频加载给你。

  • 所以我们爬虫时的思路在于找到一个个视频切片,并把他们重新组装在一起。(当然要按照顺序组装)


2. 具体操作

网站肯定有一个记录的文件记录重要信息: (文件可能的格式:M3U8 txt json => 文本)

  1. 视频播放顺序,
  2. 视频存放的路径.
    视频切片格式可能是 ts等格式

想要抓取一个视频:

  1. 找到m3u8 (各种手段)
  2. 通过m3u8下载到ts文件
  3. 可以通过各种手段(不仅是编程手段) 把ts文件合并为一个mp4文件

3. 实现代码(代码已过期,无法使用)

放出代码可能过不了审核···本文只讲述思路


总结

大家喜欢的话,给个👍,点个关注!给大家分享更多计算机专业学生的求学之路!

版权声明:

发现你走远了@mzh原创作品,转载必须标注原文链接

Copyright 2023 mzh

Crated:2023-3-1

欢迎关注 『python爬虫』 专栏,持续更新中
欢迎关注 『python爬虫』 专栏,持续更新中
『未完待续』


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

发现你走远了

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值