python爬虫实战,爬虫之路,永无止境_python爬虫 button(1)

python爬虫实战

好久没给大家跟新爬虫文章了,抱歉抱歉,这期给大家带来一篇小爬虫,希望大家喜欢,喜欢的来个关注,支持一下博主,谢谢各位了。

写代码了各位宝宝们
这里要注意一点就是要记得提前登录,cookie要用登录后的

headers = {
            'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/'
                          '87.0.4280.88 Safari/537.36',
            'Referer': 请用自己的,
            'Cookie': 请用自己的,
            'csrf': 请用自己的,
            'Host': 'www.kuwo.cn'
        }

在翻页的时候可以利用for循环进行遍历

        for i in range(page):
            start_url = f'http://www.kuwo.cn/api/www/search/searchMusicBykeyWord?key={singer\_name}&pn=' \
                        f'{i + 1}&rn=30&httpsStatus=1&reqId=d301af60-6e1e-11ec-840f-dfca3a2ceb68'

解析数据

response = requests.get(start_url, headers=headers).json()
            # 解析得到song\_names, song\_rids
            song_names = jsonpath.jsonpath(response, '$..name')
            song_rids = jsonpath.jsonpath(response, '$..rid')

遍历得到song_name, song_rid 构造song_info_url

# 遍历得到song\_name, song\_rid 构造song\_info\_url
            for song_name, song_rid in zip(song_names, song_rids):
                song_info_url = 'http://www.kuwo.cn/api/v1/www/music/playUrl?mid={}' \
                                '&type=music&httpsStatus=1&reqId=c0ac92a0-6e35-11ec-b428-05be0a87bc11'.format(song_rid)

源码展示:

# !/usr/bin/nev python
# -\*-coding:utf8-\*-

from threading import Thread
import tkinter as tk
import os, requests, jsonpath
from requests_html import HTMLSession
session = HTMLSession()


class kuwoSpider(object):

    def \_\_init\_\_(self):
        """定义可视化窗口,并设置窗口和主题大小布局"""
        self.window = tk.Tk()
        self.window.title('音乐下载器')
        self.window.geometry('800x600')

        """创建label\_user按钮,与说明书"""
        self.label_user = tk.Label(self.window, text='请输入要下载的歌手名字:',
                                   font=('Arial', 12), width=130, height=2)
        self.label_user.pack()
        """创建label\_user关联输入"""
        self.entry_user = tk.Entry(self.window, show=None, font=('Arial', 14))
        self.entry_user.pack(after=self.label_user)

        """创建label\_passwd按钮,与说明书"""
        self.label_passwd = tk.Label(self.window, text="请输入爬取页数: ", font=('Arial', 12), width=30, height=2)
        self.label_passwd.pack()
        """创建label\_passwd关联输入"""
        self.entry_passwd = tk.Entry(self.window, show=None, font=('Arial', 14))
        self.entry_passwd.pack(after=self.label_passwd)

        """创建Text富文本框,用于按钮操作结果的展示"""
        self.text1 = tk.Text(self.window, font=('Arial', 12), width=85, height=22)
        self.text1.pack()

        """定义按钮1,绑定触发事件方法"""

        self.button_1 = tk.Button(self.window, text='爬取', font=('Arial', 12), width=10, height=1,
                                  command=self.run)
        self.button_1.pack(before=self.text1)

        """定义按钮2,绑定触发事件方法"""
        self.button_2 = tk.Button(self.window, text='清除', font=('Arial', 12), width=10, height=1,
                                  command=self.parse_hit_click_2)
        self.button_2.pack(anchor="e")
    def run(self):
        Thread(target=self.parse_hit_click_1).start()

    def parse\_hit\_click\_1(self):
        """定义触发事件1,调用main函数"""
        singer_name = self.entry_user.get()
        page = int(self.entry_passwd.get())
        self.main(singer_name, page)

    def main(self, singer_name, page):
        headers = {
            'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/'
                          '87.0.4280.88 Safari/537.36',
            'Referer': 请用自己的,
            'Cookie': 请用自己的,
            'csrf': 请用自己的,
            'Host': 'www.kuwo.cn'
        }
        for i in range(page):


### 最后

> **🍅 硬核资料**:关注即可领取PPT模板、简历模板、行业经典书籍PDF。  
> **🍅 技术互助**:技术群大佬指点迷津,你的问题可能不是问题,求资源在群里喊一声。  
> **🍅 面试题库**:由技术群里的小伙伴们共同投稿,热乎的大厂面试真题,持续更新中。  
> **🍅 知识体系**:含编程语言、算法、大数据生态圈组件(Mysql、Hive、Spark、Flink)、数据仓库、Python、前端等等。




**网上学习资料一大堆,但如果学到的知识不成体系,遇到问题时只是浅尝辄止,不再深入研究,那么很难做到真正的技术提升。**

**[需要这份系统化学习资料的朋友,可以戳这里无偿获取](https://bbs.csdn.net/topics/618317507)**

**一个人可以走的很快,但一群人才能走的更远!不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!**
  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值