网页mp3提取器_用Python写一个酷狗音乐下载器!

6f5a04cfe7ef9cd823ab0a67f2ac0c7e.png

【这就是标题】

距离上一次发推送差不多有一个月了ヽ(ー_ー)ノ

做了一个小的酷狗音乐下载器,公众号内回复704就可以收到下载链接。

长下面这样。

bba31b72ee3b42b01d1d3a58468fe9ee.png

双击打开,会提示让输入你要搜索的歌曲。

aaffef4d8e7bd291f5c95bad28c020e5.png

这里输入去流浪然后回车或者鼠标点击ok,会让选择下载几首,因为音乐网站搜索歌曲会根据你的关键词出来非常多首歌,因为懒,这里就限制了第一页(一般来说前面几首大概就是你想要下载的歌曲了),酷狗一页是30首,所以最大填30。

反正超过了30代码也只按30处理(ノ ̄▽ ̄)

659bfa4cda74cf2bee01644a8c7e1423.png

回车,然后。

83ab20dc5070fc7159942522106c6e47.png

删帧删花了  ̄へ ̄

速度取决于网速,歌曲会下载到你打开下载器时的路径。

3c423f42c57a71efc895a458117640ac.png

【把公众号的内容搬了个家】

因为更新推送时间不稳定又没有推文章,而公众号的机制和B站视频的推送机制是不一样的,所以就用码云托管了一个花里胡哨的网页用来放置公众号内容。

欢迎访问:http://space-earth.gitee.io,基本上是在之前这篇内容上做了一些调整。

Starry Sky:来做个自己的网页吧!(一)​zhuanlan.zhihu.com
faab928842bb622cf2484f8f0cd286fb.png

【下面是记录音乐下载器的生产过程】

代码的基本设计思路通过搜索歌曲然后下载对应内容。

进入到酷狗网站首页随便搜索一首歌,这里仍然以去流浪为例,得到30首歌曲,如下。

c4b1625bf9132f6e8109edc98187d1d0.png

更多内容请下载客户端

此页面地址长下面这样。

2a4b746afd018100dc4f4c2fd690611e.png

一看就是老规律家了,so easy。

再点击第一首歌进入播放页,会打开一个新页面。

f3c12aac5929827ddabcf6580348c4d5.png

观察此页面地址。

c7af18e8d11275ac46e4cac9fd1e17a2.png

很容易看出来结构是.../song/+对应的hash值以及所谓的album_id,但是不是都是这样呢,经过一番验证,发现播放的歌曲地址都是这个结构。

简单了,哈希算法我虽然不熟,但我知道这个哈希值服务器是肯定要发送到客户端没跑的。

回到歌曲的搜索页面,打开开发者工具,一顿基操,发现了下面已经蓝色选中的这个脚本。

77b20b65e646db0df0e937276747a00f.png

打开预览信息一看,嚯,这数据格式我熟。

c1978e2880efd98a5128d762e2cde9a7.png

很容易地在lists当中找到了所有的歌曲信息,其中就包含了歌曲播放页面的hash值和专辑id,大功即将告成。

观察下这个脚本请求的地址。

7651bafc415d5709a0dc53e2445a6ed9.png

挤在一堆不方便梳理,往下滑看到了查询时所有应该带上的字符串参数。

2f5b385569313b138871d0574cb5df2e.png

所有的参数只有红框的部分在发生改变,第一个红框刷新几次观察结合参数名,基本是时间戳没跑了,保险起见在控制台输出一下当前时间戳发现确实是时间戳。

离成功又近了一步,才怪<( ̄ ﹌  ̄)> !

signnature,这单词我认识,签名嘛,去找一下哪里返回来的就行。

Two thousand years later...

有时候放弃也不失为一个明智的选择,没找到这玩意哪里来的。

那可咋行啊,没有这玩意就没办法组成地址,没有地址就拿不到歌曲的hash值和专辑id,没有hash值和专辑id就没法请求播放页面,没有播放需求服务器怎么会把歌曲发送给客户端,服务器不发送歌曲给客服端怎么拿到歌曲在服务器上的地址,没有歌曲地址怎么下载歌曲......

果然,有时候放弃是明智的。

callback怎么看着就那么与众不同呢,嚯,回调函数哦!我也不在这找了,换个思路去歌曲播放页面找找,很容易的在网页信息中找到了播放地址。

63a8e3f6f1081018cf02bf7fe05edee1.png

但是这个播放地址看起来是不像是好惹的,一眼看不出有啥规律,刷新一下发现紧随.com/后的是当前的时间(年月日时分),嗯,很不错。

懒得管你怎么搞的,花里胡哨的一律默认服务器都会发给我。

22897f5b066fa186dafc22d087f2526b.png

找到了,打开看一下。

864ca5812a57ae287086bb8bbbd9a95c.png

地址搞定了,复制打开一看没毛病。

53cbe6b587c162122cd965e8c523d121.png

去流浪周笔畅 - 去流浪

好,右键音频另存为保存到本地就可以了。

等,等等...是不是还忘了啥......好像是要用Python下载....

观察一下这个请求的访问地址。

28c098f2cc47f921fa073d456bb1bf22.png

也是带了一堆参数。

0184076ba9e4768f3b30f85272ade6f3.png

这熟悉的callback,你怎么长这么大了,怎么和上一页那个干干净净的callback123不太搭了,不过这都不重要。

下面第一张图片是搜索页歌曲信息对应请求地址,第二张图是播放页面歌曲信息对应请求地址。

557022039be9abb7685e7edac51bed88.png

31d62b28d20c15fafd4c5a628ec27c56.png

虽然有很多相似,但是仍然看不出来什么,难道只有去研究它的脚本文件看看回调函数到底做了哪些事情嘛?

算了算了,我记得w3c是个好东西,找了下远古时代的一篇下载器,提供了两个接口,其中一个和播放页歌曲信息请求地址很相似,另一个不曾见过,但两者都十分简单,长这样。

229ec788f32708fc073d72f88f5a40bf.png

看起来像是这些年酷狗在这个接口的基础上继续盖了东西,最后一顿操作,在第一个简单的接口上加上现在搜索页歌曲信息的这一堆callback后的参数,把privilege_filter以后的参数全部砍掉换成播放页面歌曲信息接口的最后一个查询参数,终于得到了所有歌曲信息的内容。

1dba14a146121b13b2c4897e5f05f6e0.png

这个接口只需要更改关键词即可组成该关键词搜索页面的地址,到了这一步,代码就很容易了。

贴一下。

import requests
from bs4 import BeautifulSoup
import json,sys
import easygui as g


while True:
    search = g.enterbox('请输入你想搜索的歌曲:',title='酷狗音乐下载器')
    if search ==None:
        sys.exit()
    if search!='':
        break
while True:
    number = g.enterbox('请输入你想下载多少首搜索出的歌曲,请输入对应数字(最多30):', title='酷狗音乐下载器')
    if number ==None:
        sys.exit()
    if number != '':
        break
if int(number)>30:
    number='30'

search_headers={
    'referer':'https: // www.kugou.com/song /',
    'user-agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/84.0.4147.89 Safari/537.36'
}
search_results = 'http://songsearch.kugou.com/song_search_v2?callback=jQuery19109017207142454389_1595994946923&keyword='+search + 
    '&page=1&pagesize=30&userid=-1&clientver=&platform=WebFilter&tag=em&filter=2&iscorrection=1&privilege_filter=0&_=1595994946925%27'

res=requests.get(search_results,headers=search_headers)
song_json =json.loads(res.text[res.text.index('(') + 1:-2])
song_list=song_json['data']['lists']
a=0
final_number=int(number)
for i in song_list:
    if a==int(number):
        break
    song_hash = i['FileHash']
    song_id = i['AlbumID']
    song_name = i['FileName'].replace('<em>','').replace('</em>','')
    song_url = 'https://wwwapi.kugou.com/yy/index.php?r=play/getdata&callback=jQuery19109017207142454389_1595994946923&hash='+song_hash+'&album_id='+song_id+'&dfid=1aF52t2JD7yx11ML0H2JZ9UE&mid=2391153464a766aea6860623fc508772&platid=4&_=1595994946925'
    song_res = requests.get(song_url, headers=search_headers)
    song_js = json.loads(song_res.text[song_res.text.index('(') + 1:-2])
    url = song_js['data']['play_url']
    if url!='':
        res_finnal = requests.get(url, headers=search_headers)
        with open(song_name+'.mp3', 'wb') as f:
            f.write(res_finnal.content)
        print('【'+song_name+'.mp3】下载完成')
    else:
        print('【'+song_name+'.mp3】无版权,无法下载!')
        final_number-=1
    a += 1
print('-----------------------------------')
print('【'+str(final_number)+'首音乐已下载完毕!】')

最后使用pyinstaller打包一下,就得到了本文开头的酷狗音乐下载器。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值