爬虫练习-爬取酷狗TOP500音乐信息

前言:

同上篇爬虫练习-爬取小猪短租网北京地区短租房信息一样,均为极简的爬虫,仅仅爬取酷狗TOP500音乐信息(排名、歌手名、歌曲名、歌曲时长),可供入门和想入门的朋友学习。
本文为整理代码,梳理思路,并验证代码的有效性——2019.12.7


环境:
Python3(Anaconda3)
PyCharm
Chrome浏览器

主要模块:
BeautifulSoup
requests
time

1.

先看一下请求网址

# TOP500 首页
https://www.kugou.com/yy/rank/home/1-8888.html?from=rank

在这里插入图片描述
别被这个下载客户端唬住了,经过测试,我们可以通过修改“ /home/ ”后跟的数字来访问后面的页数,如:

https://www.kugou.com/yy/rank/home/2-8888.html?from=rank  # 第二页
https://www.kugou.com/yy/rank/home/3-8888.html?from=rank  # 第三页
... 
以此类推

一页有22首歌,我们可以推算出总共有23页。

 # 构造多页URL
urls = ['http://www.kugou.com/yy/rank/home/{}
  • 0
    点赞
  • 23
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值