在专辑页面,chrome浏览器右键,点击“检查”,显示如下界面:
选Network标签,在Name里的第一条是专辑信息,第二条是当前音频信息。右侧Headers里有URL,往下拉有User-Agent。
import requests
import json
url = 'https://www.ximalaya.com/revision/play/v1/show?id=27888315&num=1&sort=1&size=30&ptype=0'
headers = {'User-Agent':
'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_13_1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/79.0.3945.130 Safari/537.36'
}
r = requests.get(url,headers=headers)
ret = r.text
url填专辑的url。这一步得到的ret就是对应的response标签和Preview标签里的内容,是字符串。response是一行,preview是分行显示,内容相同。
result = json.loads(ret)
result
上面这一步是把str转换为dict格式。
content_list = result['data']['tracksAudioPlay']
for content in content_list:
track_id = content['trackId']
track_name = content['trackName']
# 自动替换url里的id部分
url = 'https://www.ximalaya.com/revision/play/v1/audio?id=%d&ptype=1'%track_id
audio_response = requests.get(url, headers=headers)
audio_html = audio_response.text
audio_result = json.loads(audio_html)
audio_src = audio_result['data']['src']
with open('/Users/apple/Downloads/3D_music/%s.m4a'%track_name,'wb') as f:
audio = requests.get(audio_src)
f.write(audio.content)
总结:
(1)通过url和headers得到response
(2)str转化为dict
(3)通过src得到文件并保存