爬虫初初初级练习体验——用python抓取浏览器中的音乐资源(蒟蒻实战总结)

本文介绍了如何使用Python爬虫抓取网页中的音乐资源。通过理解浏览器与服务器的交互,找到音频文件的URL,利用requests库进行请求并模拟请求头以获取文件。文章详细阐述了抓取过程,包括分析网络请求、寻找音频URL、伪装请求头以及编写下载代码。
摘要由CSDN通过智能技术生成

写代码之前要先理清思路

我们要做的是用 python 抓取浏览器中的音乐资源

        我们要知道,通常我们访问浏览器中的网页来听歌,读文章,看视频都是通过浏览器中的点击、输入等操作,对目标网站的服务器发送请求,服务器给予相对的响应得以实现的。

        这意味着,如果我们可以通过浏览器听歌,那么服务器中相应的音频文件就被浏览器获取了。这就为我们用程序大规模的抓取提供了可能。哪怕网页中没有下载的相关选项,我们也可以直接将准备用于播放的音频文件直接下载到本地

明白了原理我们就可以将思路简化

即:通过程序访问网址(目标服务器),找到音频文件位置,并下载到本地。


首先补充一个小知识点

        我们对网页进行请求要用到python中的requests

import requsets
resp = requests.get(url)

requests库中的get函数可以以GET请求访问指定的url(统一资源定位系统)并将响应返回,这里我将请求URL返回的东西放进了变量resp中,所以我们只要找到返回音频文件的URL就行啦


我这里用某某音乐网站做演示,假设我们要抓取《大鱼》相关歌曲

其他的老师没教,我不会(手动狗头)

评论 6
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值