zhai男福利！Python爬取猫耳FM音频，一场酣畅淋漓的听觉盛宴！！！

到点就困告

已于 2024-01-05 21:47:25 修改

阅读量1.6k

点赞数 34

分类专栏： python爬虫及可视化文章标签：音视频

于 2024-01-05 21:32:10 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_44765053/article/details/135418071

版权

python爬虫及可视化专栏收录该内容

9 篇文章

订阅专栏

本文介绍如何使用Python和相关库如requests和re在猫耳FM上抓取音频数据，包括获取音频ID、解析JSON获取下载链接，最后实现批量下载并保存。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

目录

本文知识点

导入相关模块

解析json数据获取音频下载链接

下载保存并命名

函数整体调用

最终效果展示

前言

猫耳FM一般被称作“M站”，平台内容以女性向为主，覆盖了有声漫、广播剧、翻唱、电台等二次元及泛二次元的声音内容，是一个专注于ACG相关内容的二次元音频社区。

今天，它将是我们的受害者○( ＾皿＾)っHiahiahia…

本文知识点

1、函数构造与调用
2、多层数据解析
3、海量音频数据保存

环境与库

python 3.8
pycharm专业版
requests
re
os

实现步骤

1.获取每个音频的id
2.通过id拼接音频详情页地址
3.请求地址获取json数据
4.解析json数据获取音频地址
5.保存音频并以其名称命名

代码实现

导入相关模块

import requests
import re
import os

解析网页

def get_html(url):
    headers = {
        'Cookie': 'acw_tc=2f624a5917044582169955929e19a14ec0e690ecccc374f6f37cab9d2758df; MSESSID=4efr9ap4gadb2s08pdiq129q73; Hm_lvt_91a4e950402ecbaeb38bd149234eb7cc=1704458226; Hm_lpvt_91a4e950402ecbaeb38bd149234eb7cc=1704458285',
        'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/120.0.0.0 Safari/537.36'
    }
    response = requests.get(url, headers=headers)
    return response

获取音频id

网页右键查看网页源代码找到音频详情页地址，并使用re正则解析出其id

def get_ids(response):
    mp3_ids = re.findall('<a target="_player" href="/sound/(.*?)" title=".*?">', response.text)
    return mp3_ids

解析json数据获取音频下载链接

def get_sound(response):
    json_data = response.json()
    title = json_data['info']['sound']['soundstr']  # 标题
    sound_url = json_data['info']['sound']['soundurl']  # 音频下载链接
    return title, sound_url

下载保存并命名

def save(title, mp3_data):
    with open('mp3\\' + title + '.m4a', mode='wb') as f:
        f.write(mp3_data)
        print(title, '下载完成!')

函数整体调用


def run(url):
    response = get_html(url)
    mp3_ids = get_ids(response)
    for mp3_id in mp3_ids:
        mp3_url = 'https://www.missevan.com/sound/getsound?soundid=' + mp3_id
        response_1 = get_html(mp3_url)
        title, sound_url = get_sound(response_1)
        # title = change_title(title)
        # print(sound_url)
        mp3_data = get_html(sound_url).content
        save(title, mp3_data)

run('https://www.missevan.com/sound/m/110')

最终效果展示

什么？！当女友假装病娇对你用手铐，发现弄疼你后道歉 。好好好，今晚就梦这个！！！

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

到点就困告 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。