新手爬虫——网易云音乐分析

本文介绍了如何使用requests库爬取网易云音乐的数据,重点解析了网易云音乐的API接口和参数,以及在处理URL时去除#号的细节,通过页面分析获取歌曲ID的方法。
摘要由CSDN通过智能技术生成

 

前言

——一篇关于爬取网易云音乐的简单分析文章,仅供学习交流
本文主要分析用requests对网易云音乐进行访问时的一些问题,selenium可以很好得避开这些问题,本文不做讨论


提示:以下是本篇文章正文内容,下面案例可供参考

一、网易云音乐接口

接口链接(很多大佬都分享过了,不赘述):

https://api.imjad.cn/cloudmusic/?type=?&id=?

其中两个参数:

type  ——  调取种类,默认为song,返回歌曲信息

id      ——  歌曲id

type参数表:

在这里插入图片描述

因此,在接口的帮助下只需要获取歌曲id,就可以拿到所需要歌曲的信息,比较方便(频繁访问会被403,建议学习探讨

  • 3
    点赞
  • 15
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
Python爬虫抓取网易云音乐通常涉及网络请求、解析HTML内容以及处理数据。以下是一个简要步骤: 1. **安装必要的库**: 首先需要安装`requests`库用于发送HTTP请求获取网页内容,以及`BeautifulSoup`或`lxml`等库用于解析HTML。 ```bash pip install requests beautifulsoup4 ``` 2. **发送GET请求**: 使用`requests.get('https://music.163.com/#/artist/{artist_id}')`获取艺术家主页,将`{artist_id}`替换为你想要爬取的具体艺人ID。 3. **解析HTML**: 解析返回的HTML页面,找到包含歌曲信息的部分。BeautifulSoup可以方便地查找特定标签和属性。 ```python import requests from bs4 import BeautifulSoup url = 'https://music.163.com/#/artist/129276' response = requests.get(url) soup = BeautifulSoup(response.text, 'lxml') songs = soup.find_all('div', class_='m-c歌唱-songlist') # 查找歌曲列表部分 ``` 4. **提取数据**: 对于每个歌曲,从HTML元素中提取出歌名、歌手、封面链接等信息。这可能涉及到进一步查找嵌套的标签。 5. **存储或处理数据**: 将提取的数据保存到文件或数据库,或者直接打印出来供后续分析。 ```python for song in songs: title = song.find('a', class_='txt').text artist = song.find('span', class_='name').text cover_url = song.find('img')['src'] # 可能还需要其他操作,比如下载图片或结构化数据 print(f"歌名:{title}, 歌手:{artist}, 封面:{cover_url}") ```
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值