8月最新千千音乐爬取(requests+bs4)

最新推荐文章于 2021-07-30 15:42:23 发布

VIP文章可待月光

最新推荐文章于 2021-07-30 15:42:23 发布

阅读量646

点赞数 1

分类专栏：爬虫文章标签：千千音乐百度音乐 requests bs4 爬取千千音乐

本文链接：https://blog.csdn.net/weixin_44220464/article/details/95096286

版权

据之前千千音乐撸代码几个月了，该网站应该是月初改的加密方式，原因大概是版权问题很多音乐都下架，后面的有些音乐也不能下载，请谅解
之前可以在F12里直接找到url的，现在我用的fiddler抓包抓到
代码如下，写了三个函数，分别为单页多页爬取，这里的歌曲名没具体找，将就下

from urllib import request
from bs4 import BeautifulSoup
import requests

def get_songid_list(headers):
    # 构造歌曲id列表
    key = input('请输入歌手名字')
    item = {}
    item['key'] = key
    url_key = 'http://music.taihe.com/search?'
    #构造歌手页url
    response = requests.get(url=url_key,headers=headers,params=item)
    # 使用bs4解析源码
    html = response.text
    # 批量获取歌手的歌曲名id
    soup = BeautifulSoup(html,'lxml')
    content = soup.select('.song-title a')
    # 构造歌曲列表，方便下载
    items = []
    for c in content[0::2]:
        link_id = c.get('href').split('/')[-1]
        items.append(link_id)
    # 返回一个带有歌曲id的列表
    return

最低0.47元/天解锁文章

可待月光

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
8月最新千千音乐爬取(requests+bs4)

据之前千千音乐撸代码几个月了，该网站应该是月初盖的加密方式之前可以在F12里直接找到url的，现在我用的fiddler抓包抓到代码如下，写了三个函数，分别为单页多页爬取，这里的歌曲名没具体找，将就下from urllib import requestfrom bs4 import BeautifulSoupimport requestsdef get_songid_list(head...
复制链接

扫一扫