python爬app无水印视频_Python爬虫:短视频平台无水印下载 (上)

导入:

虽然目前有些软件还没适配,但是,我发了 Blink 后有一写人留言或者私信找我要源码,不过我还在增加适配的软件,所以还没有时间写这篇博客,今天呢,就先把我目前适配了的代码拿出来,后续还会继续适配的!

分平台解释:

皮皮虾

皮皮虾的话,我之前就已经写过一个单独的博客了,这里就不再赘述:—> Python爬虫:皮皮虾短视频无水印下载

皮皮搞笑

某皮搞笑与某皮虾很类似,也是先获取分享链接,在电脑端进行分析:

抓包分析

们可以很容易的在抓包资源 HXR 中找到某一固定的链接: https://h5.ippzone.com/ppapi/share/fetch_content ,在该链接中的 video 字段可以看到有两个链接,分别打开尝试一下可以发现: 后缀含有 wm 的链接是含有水印的视频,另一个则是我们的目标链接了,但是我们又发现,在 video 字段下,还有一个全是数字的字符串,我们在当前 json 文件中搜索可以发现:

在上一个标签 img 下,有一个 id 字段,和字符串标签一样。

知道了视频链接的存放位置和获取方式,接下来开始分析请

在尝试过几次抓包后发现,请求 URL 始终都没有变化,只是下面的 请求负载 有所变化,第三个参数 post 默认不变就好,至于前两个参数,都在分享链接跳转的链接中:https://h5.ippzone.com/pp/post/350259149175?zy_to=copy_link&share_count=1&m=0cd13da8548a1bc85813d8c60d331e22&app=&type=post&did=d2bddf23159ae495&mid=1270840711117&pid=350259149175

源码及结果

一切准备工作做好后,开始编写代码:

结果:某人音 / 抖音极速版

接下来以 某音 为例(某音极速版的解析方式和某音相同):

同样的思路,拿到分享链接到电脑浏览器中抓包分析:

拿到如下信息:

摆摊的第二天……#架子鼓演奏 #架子鼓 #乐器 #听心 https://v.douyin.com/JMKHkqt/ 复制此链接,打开【抖音短视频】,直接观看视频!

所以为了方便,使用正则表达式来提取该内容中的链接:

url = re.findall('(https?://[^\s]+)', s_url)[0] # 正则提取字符串中的链接

抓包分析

们可以在抓包资源 HXR 中找到某一请求,在该 json 文件中 play_addr 字段下可以找到视频链接,用浏览器打开:

该链接跳转到了视频是没错,不过直接跳转到了又水印的链接上,这就有点卡住了。

不过,按照某皮搞笑的链接区分来看, wm 是含有水印的视频的话。

没有加载??????? 而且我们可以发现链接根本都还没有跳转。

但是: 当我们把设备切换为手机时: 链接跳转到了无水印的视频链接:

代码及结果

当一切都分析完后,开始编写代码:

注意: 当我们去掉 wm 字段后,下载视频时,需要带上模拟手机端的请求头!

结果:由于某音和某音极速版的分享内容是一样的,无法分辨哪个平台,所以统一输出。

但是: 我发现抖音没事就爱搞幺蛾子,有时分享链接是上文所示:

有时又是一段原链接…所以我,做了一点小小的优化:

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值