打开酷狗音乐的官网,输入想要搜索的歌曲(例如《天后》),然后回车搜索,得到如下页面:
右键检查或者按F12打开开发者工具,点击JS选项,查找到如下信息,FileName就是返回的歌手名和歌曲名信息,我们要将其提取出来:
由于这个网址返回的不是标准的json格式,所以要先进行如下处理,然后再转换成json格式:
res = requests.get(url).text
js = json.loads(res[res.index(‘(’) + 1:-2])
提取到歌曲信息之后,我们输入一个序号代表要下载的歌曲序号,然后把歌曲下载下来就好了。这里需要提取出来的是FileHash,这个值会用于构造歌曲详情的URL,该URL格式如下:
http://www.kugou.com/yy/index.php?r=play/getdata&hash=
打开这个链接后会一个如下图所示的Json格式文件,其中包含了歌曲名称、歌手、歌曲时长等信息,其中play_url是歌曲链接,将其提取出来使用requests中的content下载即可。
运行截图:
完整代码
import re
import json
import time
import requests
from fake_useragent import UserAgent
ua = UserAgent()
def get_song(song_name):
search_url = “https://songsearch.kugou.com/song_search_v2?callback=jQuery112405132987859127838_1550204317910&page” \
“=1&pagesize=30&userid=-1&clientver=&platform=WebFilter&tag=em&filter=2&iscorrection=1&privilege_fil” \
“ter=0&_=1550204317912&keyword={}”.format(song_name)
headers1 = {
“UserAgent”: ua.random
}
headers2 = {
“Cookie”: “kg_mid=3786e26250f01bf2c64bc515820d9752; Hm_lvt_aedee6983d4cfc62f509129360d6bb3d=1559960644; Hm_lpvt_aedee6983d4cfc62f509129360d6bb3d=1559960644; ACK_SERVER_10015=%7B%22list%22%3A%5B%5B%22bjlogin-user.kugou.com%22%5D%5D%7D; ACK_SERVER_10016=%7B%22list%22%3A%5B%5B%22bjreg-user.kugou.com%22%5D%5D%7D; ACK_SERVER_10017=%7B%22list%22%3A%5B%5B%22bjverifycode.service.kugou.com%22%5D%5D%7D; kg_dfid=0iEqIA1uep0h0AogH30Jq1Od; kg_dfid_collect=d41d8cd98f00b204e9800998ecf8427e”,
“Host”: “www.kugou.com”,
“Referer”: “http://www.kugou.com/”,
“UserAgent”: ua.random
}
res = requests.get(search_url, headers=headers1)
print(res.text)
start = re.search(“jQuery\d+_\d+(?”, res.text)
js = json.loads(res.text.strip().lstrip(start.group()).rstrip(“)”)) # 注意:末尾有一个换行需要去掉
song_list = js[‘data’][‘lists’]
for i in range(10):
print(str(i + 1) + “>>>” + str(song_list[i][‘FileName’]).replace(‘’, ‘’).replace(‘’, ‘’))
num = int(input(“\n请输入您想要下载的歌曲序号:”))
print(“请稍等,下载歌曲中…”)
time.sleep(1)
file_hash = song_list[num - 1][‘FileHash’]
hash_url = “http://www.kugou.com/yy/index.php?r=play/getdata&hash={}”.format(file_hash)
print(hash_url)
hash_res = requests.get(hash_url, headers=headers2)
hash_js = hash_res.json() # json格式
print(hash_js)
play_url = hash_js[‘data’][‘play_url’]
自我介绍一下,小编13年上海交大毕业,曾经在小公司待过,也去过华为、OPPO等大厂,18年进入阿里一直到现在。
深知大多数Python工程师,想要提升技能,往往是自己摸索成长或者是报班学习,但对于培训机构动则几千的学费,着实压力不小。自己不成体系的自学效果低效又漫长,而且极易碰到天花板技术停滞不前!
因此收集整理了一份《2024年Python开发全套学习资料》,初衷也很简单,就是希望能够帮助到想自学提升又不知道该从何学起的朋友,同时减轻大家的负担。
既有适合小白学习的零基础资料,也有适合3年以上经验的小伙伴深入学习提升的进阶课程,基本涵盖了95%以上前端开发知识点,真正体系化!
由于文件比较大,这里只是将部分目录大纲截图出来,每个节点里面都包含大厂面经、学习笔记、源码讲义、实战项目、讲解视频,并且后续会持续更新
如果你觉得这些内容对你有帮助,可以扫码获取!!!(备注Python)
年以上经验的小伙伴深入学习提升的进阶课程,基本涵盖了95%以上前端开发知识点,真正体系化!**
由于文件比较大,这里只是将部分目录大纲截图出来,每个节点里面都包含大厂面经、学习笔记、源码讲义、实战项目、讲解视频,并且后续会持续更新
如果你觉得这些内容对你有帮助,可以扫码获取!!!(备注Python)
