python爬取西瓜、好看视频

文章介绍了使用Python的requests库发送HTTP请求,抓取并下载视频网站上的视频内容,通过遍历获取的视频列表进行保存。
摘要由CSDN通过智能技术生成
import requests

url = "https://haokan.hao123.com/haokan/ui-web/video/rec?tab=gaoxiao_new&act=pcFeed&pd=pc&num=22&shuaxin_id=17022979200000&hk_nonce=e4b8ea6af2fbf83e339b7d5ab7283415&hk_timestamp=1702297926&hk_sign=6da6f58cf44a7d46b59497797e5f7b5e&hk_token=dQh3dAVwdwNyC3cOc3t0DwZ4BAA"

headers = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/120.0.0.0 Safari/537.36 Edg/120.0.0.0'
}

r = requests.get(url, headers=headers).json()

# print(r)
videos = r['data']['response']['videos']
# print(videos)
# 遍历循环内容
for index in videos:
    title = index['title']
    play_url = index['play_url']
    # 视频内容 音频内容 content
    videos_content = requests.get(play_url,headers=headers).content
    # print(videos_content)
    # exit()
    # 保存视频
    path = 'video\\'
    with open(path +title + '.mp4' , 'wb') as f:
        f.write(videos_content)

首先,我们导入 requests 库,这是一个常用的用于发送 HTTP 请求的库。

然后,我们定义了一个 URL,这个 URL 是一个视频网站的接口,用于获取视频列表。

接下来,我们定义了 headers,这是发送请求时需要的请求头信息,包括 User-Agent。

然后,我们发送一个 GET 请求到指定的 URL,使用 headers 作为请求的头信息。并将返回的响应通过 json() 方法转换为 JSON 格式。

然后,我们从返回的 JSON 数据中获取视频列表,这个列表包含了每一个视频的标题和播放链接。

接下来,我们使用一个 for 循环遍历视频列表,获取每一个视频的标题和播放链接。

在循环中,我们使用视频的播放链接再次发送一个 GET 请求,获取视频的内容,并将内容保存到本地。

最后,我们定义了保存视频的路径,使用 open() 方法打开一个文件,并将视频内容写入文件。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值