网易云音乐项目代码的优化-----封装成类

最新推荐文章于 2024-06-17 14:04:21 发布

一个回和

最新推荐文章于 2024-06-17 14:04:21 发布

阅读量371

点赞数

分类专栏：爬虫项目文章标签：网易云音乐

本文链接：https://blog.csdn.net/g_optimistic/article/details/89843514

版权

爬虫项目专栏收录该内容

8 篇文章 0 订阅

订阅专栏

我们把之前写的代码都封装成类

import requests
from lxml import etree


class Wangyiyun(object):
    def __init__(self, base_url):
        self.content = self.request_url(base_url)
        self.parse_url()

    def request_url(self, base_url):
        headers = {
            'user-agent': "Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/72.0.3626.109 Safari/537.36"}
        response = requests.get(base_url, headers)
        content = response.content.decode('utf-8')
        tree = etree.HTML(content)
        return tree

    def parse_url(self):
        group_list = self.content.xpath('//div[@class="blk"]')
        for group in group_list:
            group_name = group.xpath('.//a/text()')
            group_link = group.xpath('.//a/@href')
            for i, j in zip(group_name, group_link):
                link = 'https://music.163.com' + j
                singer_content = self.request_url(link)
                singer_url = singer_content.xpath('//ul[@class="n-ltlst f-cb"]/li[position()>1]/a/@href')
                for url in singer_url:
                    full_url = 'https://music.163.com' + url
                    print(full_url)
                    singer_info = self.request_url(full_url)
                    li_list = singer_info.xpath('//div[@class="m-sgerlist"]/ul/li/a/text()')
                    for li in li_list:
                        print(li)


if __name__ == '__main__':
    base_url = 'https://music.163.com/discover/artist'
    Wangyiyun(base_url)

一个回和

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
网易云音乐项目代码的优化-----封装成类

我们把之前写的代码都封装成类import requestsfrom lxml import etreeclass Wangyiyun(object): def __init__(self, base_url): self.content = self.request_url(base_url) self.parse_url() def...
复制链接

扫一扫

专栏目录