Python爬虫2--BeautiSoup库

本文介绍了使用Python爬虫抓取酷狗音乐Top500榜单的思路和方法。通过分析URL规律实现翻页,目标数据包括歌曲排名、歌手、歌曲名称和歌词。爬虫结构简洁,利用BeautifulSoup库提取元素列表,并运用zip()函数进行并行输出。
摘要由CSDN通过智能技术生成

1.1爬取酷狗top500的数据

1.1.1思路分析

        (1)本次爬取得内容为酷狗Top500得音乐信息

        (2)网页版酷狗不能手动翻页,但是观察第一页URL https://www.kugou.com/yy/rank/home/1-8888.html?from=rank我们可以尝试着把1换成2,再进行浏览,恰好返回的就是第二页的信息。我们接着尝试其他数字,就会发现不同的数字就是不同的页面,这样我们就找到了URL的规律。由于每页显示22首歌曲,所以总共需要23页

        (3)我们要爬取的有排名、歌手、歌曲名、歌词。

import requests
from bs4 import BeautifulSoup
import time

headers = {
    'User-Agent':'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleW
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值