python爬取西瓜、好看视频

yuwenduo123

已于 2024-01-29 19:25:25 修改

阅读量963

点赞数 10

分类专栏： python爬虫文章标签： python 开发语言

于 2023-12-27 22:17:19 首次发布

本文链接：https://blog.csdn.net/yuwenduo123/article/details/135257213

版权

python爬虫专栏收录该内容

8 篇文章 0 订阅

订阅专栏

文章介绍了使用Python的requests库发送HTTP请求，抓取并下载视频网站上的视频内容，通过遍历获取的视频列表进行保存。

摘要由CSDN通过智能技术生成

import requests

url = "https://haokan.hao123.com/haokan/ui-web/video/rec?tab=gaoxiao_new&act=pcFeed&pd=pc&num=22&shuaxin_id=17022979200000&hk_nonce=e4b8ea6af2fbf83e339b7d5ab7283415&hk_timestamp=1702297926&hk_sign=6da6f58cf44a7d46b59497797e5f7b5e&hk_token=dQh3dAVwdwNyC3cOc3t0DwZ4BAA"

headers = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/120.0.0.0 Safari/537.36 Edg/120.0.0.0'
}

r = requests.get(url, headers=headers).json()

# print(r)
videos = r['data']['response']['videos']
# print(videos)
# 遍历循环内容
for index in videos:
    title = index['title']
    play_url = index['play_url']
    # 视频内容 音频内容 content
    videos_content = requests.get(play_url,headers=headers).content
    # print(videos_content)
    # exit()
    # 保存视频
    path = 'video\\'
    with open(path +title + '.mp4' , 'wb') as f:
        f.write(videos_content)

首先，我们导入 requests 库，这是一个常用的用于发送 HTTP 请求的库。

然后，我们定义了一个 URL，这个 URL 是一个视频网站的接口，用于获取视频列表。

接下来，我们定义了 headers，这是发送请求时需要的请求头信息，包括 User-Agent。

然后，我们发送一个 GET 请求到指定的 URL，使用 headers 作为请求的头信息。并将返回的响应通过 json() 方法转换为 JSON 格式。

然后，我们从返回的 JSON 数据中获取视频列表，这个列表包含了每一个视频的标题和播放链接。

接下来，我们使用一个 for 循环遍历视频列表，获取每一个视频的标题和播放链接。

在循环中，我们使用视频的播放链接再次发送一个 GET 请求，获取视频的内容，并将内容保存到本地。

最后，我们定义了保存视频的路径，使用 open() 方法打开一个文件，并将视频内容写入文件。