在播放某个音乐时,网易云音乐会通过使用其api来解析这首音乐的id。
用Eminem的Rap God来举例。
https://music.163.com/#/song?id=27853227
#注意其中显示此音乐的id为27853227
网易云用于解析id的api
https://music.163.com/song/media/outer/url?id=[id号]
Rap God: https://music.163.com/song/media/outer/url?id=27853227
访问这个链接,会直接跳转到这首歌的下载地址
https://m10.music.126.net/20181222125620/84340481235d7563b80a0536ecb6adb6/ymusic/2057/c470/618a/511a158c95fa942e8eeb0c6171684652.mp3
#注:由于这个站点会检查Referer,直接访问这个链接是没有用的,要通过上面的api来访问
根据我的多次实践,绝大多数的浏览器并不会直接下载这个音乐文件,而是直接在浏览器中播放,并且是没有下载选项的。
但是由于暴露出了文件位置,我们可以使用爬虫来下载此音乐。大致思路是先访问api,从返回的头信息中获取要跳转的Location,然后利用urllib.urlretrieve()
来下载音乐文件。
定义headers
headers = {
'User-agent':
'Mozilla/5.0 (X11; Linux x86_64; rv:57.0)Gecko/20100101 Firefox/57.0',
'Host':'music.163.com',
'Referer':'https://music.163.com'}
访问api
import requests
ID = '27853227'
url = 'https://music.163.com/song/media/outer/url?id='
req = requests.get(url+ID, headers