写个爬虫总共分几步?3步
打开冰箱门.....不是,1.你想要爬取的的url
2.发送请求
3.分析返回的数据
我用的是python3.9,
我们首先把框架写好
这次使用下载音乐的url为
https://music.163.com/song/media/outer/url?id=(音乐id).mp3
我们去网易云官网搜所一首音乐,我搜的是《你从未离去》,在爬这首歌之前,先包装一下我们的爬虫 ,按f12再刷新一下网页,点击network如图
我们再点击music.163.com,复制user-agent:每个人的user-agent都是不一样的,所以我们要亲自动手去复制,我的是这样的
user-agent:
Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/94.0.4606.54 Safari/537.36
我们修改一下自己的爬虫
按照下图的步骤找到所下载音乐的id
我们爬取音乐的东西就齐全了,完善过后就是如图,content就是用来下载的
我们把请求来的东西以二进制形式写成mp3的格式,程序就写好了,如图
我们运行一下看看:
唉,可以播放,是不是非常的简单,想要爬取别的音乐就按照相同的方法获取id改url就可以了,希望这个爬虫可以引起更多人对编程的兴趣,要用于学习,虽然这么简单的爬虫也没什么亮眼的地方,但它应该是炒鸡简单了吧,今天不得网易云上号吗
ps:千万不要用for循环之类的频繁爬取音乐,这样会被封ip的