趣味学python（024）

最新推荐文章于 2023-08-02 16:02:30 发布

大笨钟47

最新推荐文章于 2023-08-02 16:02:30 发布

阅读量376

点赞数

分类专栏： python（学习爬虫）

本文链接：https://blog.csdn.net/qq_45033722/article/details/103375146

版权

python（学习爬虫）专栏收录该内容

19 篇文章 0 订阅

订阅专栏

小编今天学习了爬取了QQ音乐相关的歌曲

小编，今天以爬取李荣浩的歌单为例：

首先，找到播放源。我们根据结果反推。打开开发者工具，我们找到了，相关的播放源的地址。
在这里插入图片描述

我们观察他的请求头：

guid: 4644736###
vkey: 8E1903D58199DB5B334FC489D78ADDDFB2F76CA875750D80A49DAF5B22766BE81311B4D332B73D2355D5A148DB2FD8AAC5D34FEC89FCAB52
uin: 4053
fromtag: 66

多次生成页面发现，只有 vkey 在变化，其他的与 qq 号相关联的，需要在登陆状态下才能，获取。

我们返回歌单列表，查找 guid，找到了

client_search_cp?ct=24&qqmu........

如上这个文件，查看相应的响应头的信息。
在 song.list 下面有我们想要的内容：

在这里插入图片描述
我们可以找到 guid 等相关的信息。

关于vkey，我们发现这个参数每次刷新页面的时候都在变化，
于是我们断定，vkey为加密参数。

在这里插入图片描述

同样的，我们复制vkey 到前面的现在列表去查找定位。

在这里插入图片描述

注意到其中比较重要的参数：

data: {"req_0":{"module":"vkey.GetVkeyServer","method":"CgiGetVkey","param":{"guid":"46447369##","songmid":["000rMFLS0ZnngN"],"songtype":[0],"uin":"10918993##","loginflag":1,"platform":"20"}},"comm":{"uin":10918993##,"format":"json","ct":24,"cv":0}}

为 songmid，同样的根据 songid到前面的歌单列表种进行查找。

我惊奇的发现，他就在之前我们找的那个响应头里面：

在这里插入图片描述
我多次刷新了页面，发现 songMID并未出现任何变化：
这下连构造参数都不用了，直接进行请求访问。

代码如下：

import requests
import json
import os


headers = {
    'Origin': 'https://y.qq.com',
    'Referer': 'https://y.qq.com/portal/search.html',
    'Sec-Fetch-Mode': 'cors',
    'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/77.0.3865.90 Safari/537.36'
}


def get_params():
    page = 1
    num= 10
    name = '李荣浩'
    url1 = 'https://c.y.qq.com/soso/fcgi-bin/client_search_cp?ct=24&qqmusic_ver=1298&new_json=1&remoteplace=txt.yqq.song&searchid=56300239556678595&t=0&aggr=1&cr=1&catZhida=1&lossless=0&flag_qc=0&p=1&n=10&w=%E6%9D%8E%E8%8D%A3%E6%B5%A9&g_tk=5381&loginUin=10918993##&hostUin=0&format=json&inCharset=utf8&outCharset=utf-8&notice=0&platform=yqq.json&needNewCode=0'
    response1 = requests.get(url1, headers=headers).json()
    # print('response1', response1)
    # 获取相关的 参数
    music_list = []
    song_list = []
    for list in response1['data']['song']['list']:

        music_name = list['name']
        music_singer = list['singer'][0]['name']
        music_mid = list['file']['media_mid']
        music_list.append([music_singer, music_name, music_mid])

    for song in response1['data']['zhida']['zhida_singer']['hotsong']:
        song_list.append(song['songMID'])
        # print(song['songMID'])


    # print(music_list)
    return [music_list, song_list]

def get_url_vkey(music_list):
    music_data = []
    for a, music in enumerate(music_list[0]):
        music_name = music[1]
        singer_name = music[0]
        songmid = music_list[1][a]
        # print(songmid)
        # data.zhida.zhida_singer.hotsong[0].songMID
        url = 'https://u.y.qq.com/cgi-bin/musicu.fcg?data={"req":{"module":"CDN.SrfCdnDispatchServer","method":"GetCdnDispatch","param":{"guid":"46447369##","calltype":0,"userip":""}},"req_0":{"module":"vkey.GetVkeyServer","method":"CgiGetVkey","param":{"guid":"46447369##","songmid":["%s"],"songtype":[0],"uin":"10918993##","loginflag":1,"platform":"20"}},"comm":{"uin":10918993##,"format":"json","ct":24,"cv":0}}' % songmid
        # 下面来获取 purl 用来请求获取vkey参数
        response = requests.get(url).json()
        # print(response)
        purl = response['req_0']['data']['midurlinfo'][0]['purl']
        sing_url = 'http://ws.stream.qqmusic.qq.com/' + purl
        music_data.append(
            {
                'music_name': music_name,
                'singer_name': singer_name,
                'full_media_url': sing_url
            }
        )
    print(music_data)

    return music_data

def download_song(music_data):
    if not os.path.exists('歌曲下载'):  # 判断是否有歌曲下载文件夹
        os.mkdir('歌曲下载')  # 如果没有创建 歌曲下载文件夹
    for music in music_data:
        music_name = music['music_name']
        singer_name = music['singer_name']
        full_url = music['full_media_url']
        music_response = requests.get(full_url, headers=headers).content
        with open('歌曲下载/%s-%s.mp3' % (music_name, singer_name), 'wb')as fp:
            try:
                fp.write(music_response)
                print('[%s]保存成功！' % music_name)
            except Exception as e:
                print(e)

'''
data.zhida.zhida_singer.hotsong[0].songMID
req_0.data.midurlinfo[0].purl
    C400001dPKD40OUxFz.m4a?
    C400001dPKD40OUxFz.m4a?
    
    guid":"46447369##","songmid":["001dPKD40OUxFz"] 获取vkey
    
    80D195E93D59950F1EC600F318DF6D60FF92F8FE3BAC4AE3430F624D823E88D31EB30402729F82D28618A0F0711D9C6ABAA8DD069F63F81D
'''


if __name__ == '__main__':
    music_data = get_url_vkey(get_params())
    download_song(music_data)