教你用20行代码来爬取某某云的榜单音乐

今天来教大家爬爬音乐,哈哈哈哈
在这里插入图片描述

前期准备

软件环境

  • pycharm3.8
  • pycharm

模块

requests、re、os 三个
其中requests是第三方模块需要手动安装一下
re、os都是内置模块,不需要安装

浏览器开发者工具
咱们需要学会如何使用开发者工具。
对此很多小伙伴都不会,因为每个浏览器的开发者工具细节上多少有一些差别,我建议都用谷歌浏览器,英文看不懂的话可以调成中文。

打开开发者工具,点击省略号,点击 shortcuts
在这里插入图片描述
依次点击 preferences - language ,
直接拉到最下方选择中文即可。
在这里插入图片描述

代码实现

本次实现步骤大致分为以下五步:

  1. 发送请求
  2. 获取数据
  3. 解析数据
  4. 保存数据

这里我就不讲怎么分析开发者工具了,有空(摸鱼 )做一个详细的教程,讲解开发者工具。

导入模块

import requests 
import re  
import os  

发送请求

url = 'https://网址自己打一下/discover/toplist?id=3778678'
headers = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/81.0.4044.138 Safari/537.36'
}
response = requests.get(url=url, headers=headers)

获取数据

result = re.findall('<li><a href="/song\?id=(\d+)">(.*?)</a></li>', response.text)
for music, title in result:
    music_url = f'http://music.163.com/song/media/outer/url?id={music}.mp3'
    music_content = requests.get(url=music_url, headers=headers).content

保存数据

with open(filename + title + '.mp3', mode='wb') as f:
    f.write(music_content)
    print(title)

当然这只是最简单的爬取榜单歌曲,
评论、歌词等等都可以爬取,
还有制作词云图、通过搜索下载,音乐下载器,
等等各种实现下载的方式。

好了,今天的分享就到这里,完整代码评论区“1”获取哈~
在这里插入图片描述

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值