python3爬虫实例(一)---爬取酷狗TOP500的音乐信息

前言

学习完requests库与beautifulsoup这个库后,我们就可来搞一个简单的爬虫了,这次我们爬取酷狗音乐的TOP500的歌曲信息,包含排名,歌名,歌曲时长。分分钟爬取下来。

分析URL链接

http://www.kugou.com/yy/rank/home/1-8888.html , 这个是酷狗TOP500歌曲信息页面,我们发现这里并不能翻页,一页只能显示,22首歌曲,如果我们直接用这个链接就只能爬取这一页的22首歌曲的信息。所以我们要想办法。
观察这个链接,看到这个1-8888.html 我们只需要修改这个1就可以实现换页,例如把1修改成2:http://www.kugou.com/yy/rank/home/2-8888.html, 他就可显示下一页的歌曲信息,计算一下,每页22首,共有500 ,可以算出一共有23页,也就是23个URL

分析网页结构

分析网页这个需要了解点html的基础知识,我们先将第一页的歌曲信息弄下来

http://www.kugou.com/yy/rank/home/1-8888.html, 打开链接 审查元素 点击 酷狗TOP500ÿ

  • 6
    点赞
  • 37
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值