使用python爬取视频

写在前面:此博客仅用于参考学习,代码中部分网址已删

准备工作

  1. python
  2. burpsuite

视频爬取

视频网址:https://v.qq.com/x/cover/mzc00200xnrv1u5.html

使用h5播放器播放网址内视频,右击选择复制调试信息
在这里插入图片描述
将复制好的调试信息找个js在线解析工具进行解析,解析好的数据如下,发现视频m3u8相关文件地址在这里插入图片描述
对vurl进行解码在这里插入图片描述访问解码后的网址,可以下载一个m3u8文件,里面保存了视频各片段的位置
在这里插入图片描述

burpsuite抓包

(也可使用chrome自带的network进行筛选,但我感觉用不来)

播放正片,并进行拦截,抓包结果如下:
在这里插入图片描述
由其中的一个带有ts片段的包得到所有视频片段的上级网址,由此可以得到所有视频片段的真实地址。

视频下载

由上所得编写python脚本下载视频

import os
import requests
from bs4 import BeautifulSoup

header = {
    "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/86.0.4240.111 Safari/537.36"
}

base_url='https://apd-adeb75b3bf37b1aa406b04cc29fda836.v.smtcdns.com/varietyts.tc.qq.com/AZCNwLTijzPtfQ76cdHIH9BK7fMxN1rPKprjstzdwyuE/uwMROfz2r5zAoaQXGdGnC2df644E7D3uP8M8pmtgwsRK9nEL/xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx/'
fp=open(r'C:\Users\19871\Desktop\z00368kgril.321002.ts.m3u8','r')
with open(r'C:\Users\19871\Desktop\test.ts','wb') as f:
    while True:
        line=fp.readline().replace('\n','')
        if line:
            if line[0]!='#':
                url=base_url+line
                r=requests.get(url,headers=header)
                f.write(r.content)
                f.flush()
        else:
            break
f.close()
fp.close()
print('爬取完毕')       

下载完成后如下:

在这里插入图片描述
正常播放
在这里插入图片描述

  • 1
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 3
    评论
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值