Python爬取歌曲网站MP3资源

目录

爬取网站

网站分析

搜索歌曲

搜索结果

歌曲详细页面

爬虫思路


爬取网站

搜索网盘 酷美网盘 支持外链 免费网盘

爬取内容:一份文档,包含所有需要下载的歌曲名称,一行一首,爬取到的MP3或MP4资源会放在Audios文件夹下

网站分析
搜索歌曲

在该网站搜索歌曲会发送一个request请求,url为:

https://www.kumeiwp.com/index/search/data?page=1&limit=50&word=%E5%88%80%E9%83%8E&scope=all

分析:word参数的内容为搜索的歌曲名

搜索结果

网站返回一个json文件,如下

data键包含了当前页面所有歌曲的数据,包括歌曲的id,下载次数,大小,浏览次数,标题,下载连接等等

歌曲详细页面

歌曲的详细页面如下

本地下载就是歌曲的下载链接。

爬虫思路

如此,爬虫的思路明确了

  1. 获取歌曲名,合成搜索歌曲的url

  2. 获取搜索结果的json数据

  3. 获取目标歌曲的详细页面url

    1. 只爬取第一页的搜索结果,按下载量排序,打印前三的歌曲名,调用input选择歌曲下载

  4. 获取歌曲的下载地址

  5. 下载歌曲到指定目录

具体代码见github仓库

GitHub - TsuandaoNewone/Python-: 爬取网站:https://www.kumeiwp.com/index/search

### 使用 Python 实现网易云音乐 MP3 下载 为了实现网易云音乐的MP3文件下载,可以按照如下方式构建程序逻辑: #### 1. 获取加密参数 由于网易云音乐接口采用了加密措施,因此需要先解决`encSecKey` 和 `params` 的生成问题。幸运的是网络上存在大量教程可以帮助理解和实现这两个重要参数的计算[^1]。 ```python import hashlib import json from Crypto.Cipher import AES import base64 def create_secret_key(size): return (''.join([hex(i)[2:] for i in os.urandom(int(size))])).upper() def aes_encrypt(text, key): iv = b'0102030405060708' pad = lambda s: s + (16 - len(s)%16) * chr(16 - len(s)%16) text = pad(text).encode() cipher = AES.new(key.encode(), AES.MODE_CBC, iv) encrypted_bytes = cipher.encrypt(text) return base64.b64encode(encrypted_bytes).decode('utf-8') # 示例函数用于创建 encSecKey 和 params 参数 secret_key = create_secret_key(16) text = {"hlpretag":"<span class=\"s-fc7\">","hlposttag":"</span>","s":"","type":"1","offset":"0","total":"true","limit":"30","csrf_token":""} params = aes_encrypt(json.dumps(text), "0CoJUm6Qyw8W8jud") encSecKey = "xxx" # 这里应替换为实际生成的 secKey 值 ``` #### 2. 发送请求并解析响应数据 利用上述获得的加密参数向目标API发送POST请求,并处理返回的数据以提取歌曲ID和其他必要信息。 ```python import requests url = 'https://music.163.com/weapi/cloudsearch/get/web?csrf_token=' headers = { 'User-Agent': 'Mozilla/5.0', 'Referer': 'http://music.163.com/', } data = {'params': params, 'encSecKey': encSecKey} response = requests.post(url=url, headers=headers, data=data) if response.status_code == 200: songs_info = response.json()['result']['songs'] else: raise Exception(f'Request failed with status code {response.status_code}') ``` #### 3. 构建下载链接与保存路径 对于每首歌的信息,构造其对应的媒体资源URL,并指定本地存储位置以便后续操作。 ```python for idx, item in enumerate(songs_info[:]): song_id = str(item['id']) song_name = item.get('name', f'song_{idx}') # 如果名字为空则给默认名 media_url = get_media_url(song_id=song_id) # 自定义方法获取具体音频 URL file_path = './downloads/' + song_name.replace('/', '_') + '.mp3' download_file(media_url=media_url, output=file_path) print('下载完成' + str(len(songs_info)) + '个音乐,快去沉浸到音乐当中去吧!') ``` 请注意,在实际应用过程中还需要考虑异常情况下的错误处理机制以及可能存在的版权保护等问题。
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值