python爬虫下载网易云榜单音乐

最新推荐文章于 2025-01-20 15:52:43 发布

xiaolong111111122222

最新推荐文章于 2025-01-20 15:52:43 发布

阅读量255

点赞数 4

文章标签： python 爬虫开发语言

本文链接：https://blog.csdn.net/jeuuhebf/article/details/143165386

版权

import requests#数据请求模块 第三方模块 pip install requests
import re#正则表达式模块 内置模块
import os#文件操作模块
#headers请求头 就是用伪装python代码的 把python代码伪装成浏览器对于服务器发送请求
#服务器接收到请求之后，会给我们返回响应数据(requests)
filename = 'music\\'
if not os.path.exists(filename):#如果没有music文件夹则会创建一个music文件
    os.mkdir(filename)

url = 'https://music.163.com/discover/toplist?id=19723756'
headers = {

'user-agent':'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/94.0.4606.71 Safari/537.36 Core/1.94.192.400 QQBrowser/11.5.5250.400'

}
response = requests.get(url=url,headers=headers)
#print(response.text)
html_data = re.findall('<li><a href="/song\?id=(\d+)">(.*?)</a></li>',response.text)
#正则表达式提取出来的一个内容 返回的是列表 里面每一个元素都是元组
for num_id,title in html_data:
    music_url = f'http://music.163.com/song/media/outer/url?id={num_id}.mp3'
    #对于音乐播放地址发送请求 获取二进制数据内容
    music_content=requests.get(url=music_url,headers=headers).content
    with open(filename+title+'.mp3',mode='wb')as f:
        f.write(music_content)
    print(num_id,title)