Python 爬虫项目实战：爬取某云歌手页歌曲_python爬虫爬取音乐单曲

懒大王爱吃狼

于 2024-08-14 15:59:33 发布

阅读量517

点赞数 27

文章标签： python 爬虫开发语言 ipython pandas flask

本文链接：https://blog.csdn.net/m0_65482549/article/details/141192306

版权

网络爬虫（Web Crawler），也称为网页蜘蛛（Web Spider）或网页机器人（Web Bot），是一种按照既定规则自动浏览网络并提取信息的程序。爬虫的主要用途包括数据采集、网络索引、内容抓取等。

爬虫的基本原理

爬虫的分类

爬虫的合法性和道德

在编写和运行爬虫时，必须遵循以下原则：

遵守网站的 robots.txt：
- 大多数网站都有一个 robots.txt 文件，规定了哪些页面允许被爬取，哪些不允许。爬虫应当尊重这些规则。
避免过度抓取：
- 设置适当的抓取频率，避免对服务器造成过大负担。
尊重版权和隐私：
- 不应抓取或使用受版权保护的内容，或涉及用户隐私的数据。
获取许可：
- 在某些情况下，最好获得网站管理员的许可，特别是当你打算频繁地抓取大量数据时。

通过以上方法和原则，可以编写高效、可靠且合规的网络爬虫来满足数据采集的需求。

打开页面
我们需要的就是他的这个页面的网页
在这里插入图片描述

F12 检查定位关键元素
筛选歌曲数据（或者右键点击检查）
在这里插入图片描述

拿到歌曲数据之后再进行裁剪

接下来通过这个下载接口链接获取歌曲，把这个id粘贴到这个请求头后面

看一下结果

可以听到的是正确的歌曲

接下来创建一个文件夹接收一下
在这里插入图片描述

复制这个链接
在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

关注