import requests#数据请求模块 第三方模块 pip install requests
import re#正则表达式模块 内置模块
import os#文件操作模块
#headers请求头 就是用伪装python代码的 把python代码伪装成浏览器对于服务器发送请求
#服务器接收到请求之后,会给我们返回响应数据(requests)
filename = 'music\\'
if not os.path.exists(filename):#如果没有music文件夹则会创建一个music文件
os.mkdir(filename)
url = 'https://music.163.com/discover/toplist?id=19723756'
headers = {
'user-agent':'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/94.0.4606.71 Safari/537.36 Core/1.94.192.400 QQBrowser/11.5.5250.400'
}
response = requests.get(url=url,headers=headers)
#print(response.text)
html_data = re.findall('<li><a href="/song\?id=(\d+)">(.*?)</a></li>',response.text)
#正则表达式提取出来的一个内容 返回的是列表 里面每一个元素都是元组
for num_id,title in html_data:
music_url = f'http://music.163.com/song/media/outer/url?id={num_id}.mp3'
#对于音乐播放地址发送请求 获取二进制数据内容
music_content=requests.get(url=music_url,headers=headers).content
with open(filename+title+'.mp3',mode='wb')as f:
f.write(music_content)
print(num_id,title)
python爬虫下载网易云榜单音乐
最新推荐文章于 2025-01-20 15:52:43 发布