python爬虫视频网站例如txsp（不推荐轻易尝试）

最新推荐文章于 2024-07-12 16:16:27 发布

sueerlee

最新推荐文章于 2024-07-12 16:16:27 发布

阅读量588

点赞数 8

文章标签： python 网络爬虫

本文链接：https://blog.csdn.net/sueerlee/article/details/135097421

版权

import requests

url="https://v.qq.com/"#目标网站，例如腾讯网站

headers={
    "User-Agent":"Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/109.0.0.0 Safari/537.36 Edg/109.0.1518.52"
}
n=1
response=requests.get(url=url,headers=headers)
with open("三生三世十里桃花第一集.txt","wb") as fp:
    fp.write(response.content)

with open("三生三世十里桃花第一集.txt",mode="r",encoding="utf-8") as fp:
    for line in fp:
        line=line.strip()
        if line.startswith("#"):
            continue
        last_tspath="https://v8.dious.cc"+line
        resp3=requests.get(last_tspath)
        f=open(f"{n}.ts",mode="wb")
        f.write(resp3.content)
        n+=1

一个简单的示例分为三部，上面先展示一个示例源码

1.获取m3u8文件
— m3u8文件将视频切片为一个个片段，时长不定，一般较短，可以通过获取m3u8文件获取对应ts文件链接，进而进行片段视频的下载，不过后续要使用第三方工具进行视频的整合，将一个个片段视频还原为整个视频。

2.进行ts视频下载
获取到的m3u8通过python函数，进行字符串处理，进行进行一个个片段视频的下载，视频以二进制格式存储，因此下载时，应使用.content方法进行下载；最后MP4格式进行持久化存储。

三.步骤分析及成果展示
这里给大家说出我自己的方法，可以先用抓包工具获取视频元素，可以发现大多数都是在video标签；此时可以查看网页源代码中是否有video标签，一般不会有，大家可以试试，这样自己才能理解的更加深刻。
故视频是通过ajax进行加载的，所以可以在"<script.>"标签中搜索video，这时候可能会有收获;再者，可以通过抓包工具进行搜索，

sueerlee

关注

8
点赞
踩
11

收藏

觉得还不错? 一键收藏
1
评论
python爬虫视频网站例如txsp（不推荐轻易尝试）

m3u8文件将视频切片为一个个片段，时长不定，一般较短，可以通过获取m3u8文件获取对应ts文件链接，进而进行片段视频的下载，不过后续要使用第三方工具进行视频的整合，将一个个片段视频还原为整个视频。获取到的m3u8通过python函数，进行字符串处理，进行进行一个个片段视频的下载，视频以二进制格式存储，因此下载时，应使用.content方法进行下载；故视频是通过ajax进行加载的，所以可以在"<script.>"标签中搜索video，这时候可能会有收获;再者，可以通过抓包工具进行搜索，
复制链接

扫一扫