小编今天学习了爬取了QQ音乐 相关的歌曲
小编,今天以爬取 李荣浩 的歌单为例:
首先,找到播放源。 我们根据结果反推 。打开开发者工具,我们找到了,相关的播放源的地址。
我们观察他的请求头:
guid: 4644736###
vkey: 8E1903D58199DB5B334FC489D78ADDDFB2F76CA875750D80A49DAF5B22766BE81311B4D332B73D2355D5A148DB2FD8AAC5D34FEC89FCAB52
uin: 4053
fromtag: 66
多次生成页面发现,只有 vkey 在变化,其他的与 qq 号相关联的,需要在登陆状态下才能,获取。
我们 返回歌单列表,查找 guid,找到了
client_search_cp?ct=24&qqmu........
如上这个文件,查看相应的 响应头的信息。
在 song.list 下面 有我们想要的内容:
我们可以 找到 guid 等相关的信息。
关于vkey,我们发现这个参数 每次刷新页面的时候都在变化,
于是我们断定,vkey为加密参数。
同样的,我们复制vkey 到前面的 现在 列表去查找定位。
注意到 其中比较重要的参数:
data: {"req_0":{"module":"vkey.GetVkeyServer","method":"CgiGetVkey","param":{"guid":"46447369##","songmid":["000rMFLS0ZnngN"],"songtype":[0],"uin":"10918993##","loginflag":1,"platform":"20"}},"comm":{"uin":10918993##,"format":"json","ct":24,"cv":0}}
为 songmid, 同样的根据 songid到前面的歌单列表种进行查找。
我 惊奇 的发现,他就在之前 我们找的那个 响应头里面:
我多次刷新了页面,发现 songMID并未出现任何变化:
这下 连构造 参数都不用了,直接进行请求访问。
代码如下:
import requests
import json
import os
headers = {
'Origin': 'https://y.qq.com',
'Referer': 'https://y.qq.com/portal/search.html',
'Sec-Fetch-Mode': 'cors',
'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/77.0.3865.90 Safari/537.36'
}
def get_params():
page = 1
num= 10
name = '李荣浩'
url1 = 'https://c.y.qq.com/soso/fcgi-bin/client_search_cp?ct=24&qqmusic_ver=1298&new_json=1&remoteplace=txt.yqq.song&searchid=56300239556678595&t=0&aggr=1&cr=1&catZhida=1&lossless=0&flag_qc=0&p=1&n=10&w=%E6%9D%8E%E8%8D%A3%E6%B5%A9&g_tk=5381&loginUin=10918993##&hostUin=0&format=json&inCharset=utf8&outCharset=utf-8¬ice=0&platform=yqq.json&needNewCode=0'
response1 = requests.get(url1, headers=headers).json()
# print('response1', response1)
# 获取相关的 参数
music_list = []
song_list = []
for list in response1['data']['song']['list']:
music_name = list['name']
music_singer = list['singer'][0]['name']
music_mid = list['file']['media_mid']
music_list.append([music_singer, music_name, music_mid])
for song in response1['data']['zhida']['zhida_singer']['hotsong']:
song_list.append(song['songMID'])
# print(song['songMID'])
# print(music_list)
return [music_list, song_list]
def get_url_vkey(music_list):
music_data = []
for a, music in enumerate(music_list[0]):
music_name = music[1]
singer_name = music[0]
songmid = music_list[1][a]
# print(songmid)
# data.zhida.zhida_singer.hotsong[0].songMID
url = 'https://u.y.qq.com/cgi-bin/musicu.fcg?data={"req":{"module":"CDN.SrfCdnDispatchServer","method":"GetCdnDispatch","param":{"guid":"46447369##","calltype":0,"userip":""}},"req_0":{"module":"vkey.GetVkeyServer","method":"CgiGetVkey","param":{"guid":"46447369##","songmid":["%s"],"songtype":[0],"uin":"10918993##","loginflag":1,"platform":"20"}},"comm":{"uin":10918993##,"format":"json","ct":24,"cv":0}}' % songmid
# 下面来获取 purl 用来请求获取vkey参数
response = requests.get(url).json()
# print(response)
purl = response['req_0']['data']['midurlinfo'][0]['purl']
sing_url = 'http://ws.stream.qqmusic.qq.com/' + purl
music_data.append(
{
'music_name': music_name,
'singer_name': singer_name,
'full_media_url': sing_url
}
)
print(music_data)
return music_data
def download_song(music_data):
if not os.path.exists('歌曲下载'): # 判断是否有歌曲下载文件夹
os.mkdir('歌曲下载') # 如果没有创建 歌曲下载文件夹
for music in music_data:
music_name = music['music_name']
singer_name = music['singer_name']
full_url = music['full_media_url']
music_response = requests.get(full_url, headers=headers).content
with open('歌曲下载/%s-%s.mp3' % (music_name, singer_name), 'wb')as fp:
try:
fp.write(music_response)
print('[%s]保存成功!' % music_name)
except Exception as e:
print(e)
'''
data.zhida.zhida_singer.hotsong[0].songMID
req_0.data.midurlinfo[0].purl
C400001dPKD40OUxFz.m4a?
C400001dPKD40OUxFz.m4a?
guid":"46447369##","songmid":["001dPKD40OUxFz"] 获取vkey
80D195E93D59950F1EC600F318DF6D60FF92F8FE3BAC4AE3430F624D823E88D31EB30402729F82D28618A0F0711D9C6ABAA8DD069F63F81D
'''
if __name__ == '__main__':
music_data = get_url_vkey(get_params())
download_song(music_data)
如有错误还请更正!!!