python爬虫爬取音频文件

本文介绍了如何使用Python爬虫抓取喜马拉雅FM的音频文件。通过分析网络请求,发现音频文件存储在以album开头的JSON文件中,通过设置请求头绕过限制。通过观察URL规律,实现了翻页功能,抓取多页音频链接。最后,将音频文件以二进制形式保存,但需注意避免磁盘空间不足的问题。
摘要由CSDN通过智能技术生成

python爬取喜马拉雅FM音频文件一说春秋 (https://www.ximalaya.com/lishi/4164479/)这是从喜马拉雅网站随便找的一个


在这里插入图片描述
此时打开开发者选项,点开network查看你会发现并没有存放json文件也就找不到音频文件,此时你打开音频开关,点击播放全部你会发现多了一个album开头的你打开之后就会发现这个文件就是存放音频文件的json文件。
在这里插入图片描述
这时候你会发现里面的src是一个m4a的链接,打开之后就会发现这就是我们要找的音频文件,下面这是代码。

import requests
import json
import jsonpath
index=1
for i in range(1,26):
	jsonUrl='https://www.ximalaya.com/revision/play/albu
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值