网不好,看个漫画加载半天?教你用Python批量下载网站所有漫画(附源码和视频教程)

首先咱们用的是这些环境

Python3.6 
pycharm

涉及到的知识点

requests
parsel   pip install 模块名
re
os

大概流程

一、单章节爬取

  1. 找到受害者 https://www.kuimh.com/chapter/332265-3351141
  2. 向受害者发送请求
  3. 获取数据:获取源代码
  4. 解析网页源代码: 提取漫画章节名, 每一页图片所在地址
  5. 保存数据: 图片数据

二、整本漫画爬取

  1. 请求 https://www.kuimh.com/book/mh10575
  2. 获取数据:获取源代码
  3. 解析网页源代码: 获取每一话所在地址
  4. 循环爬取,保存数据
import os
import re
import parsel
import requests

1.正确url地址(静态\动态)

url = "https://www.kuimh.com/book/mh10575"

获取动漫章节链接和章节名

response = requests.get(url=url)
selector = parsel.Selector(response.text)

伪类选择器nth-child(第几个标签)
::text 获取文本内容
::attr 获取标签属性值

title_list = selector.css('#detail-list-select li a:nth-child(2)::text').getall()
url_list = selector.css('#detail-list-select li a:nth-child(2)::attr(href)').getall()
if not os.path.exists('./妖神记/'):
    os.makedirs('./妖神记/')

f:可以传入参数

复制代码

for title, url in zip(title_list, url_list):
print(f'--------------------------正在爬取{title}-------------------------')
index = 1
target_url = f"https://www.kuimh.com{url}"
resp = requests.get(target_url)
selector = parsel.Selector(resp.text)
sub_url_list = selector.css('.comicpage div img::attr(src)').getall()[:3]
sub_list = selector.css('.comicpage div img::attr(data-echo)').getall()
for i in sub_list:
    sub_url_list.append(i)

复制代码

r:防止字符串转义

复制代码

title = re.sub(r'[\/:*?"<>|.]', "", title)
    if not os.path.exists('./妖神记/' + title):
        os.makedirs('./妖神记/' + title)
    for url_ in sub_url_list:
        image = requests.get(url_).content
        with open('./妖神记/' + title + '/'+'第'+str(index)+'页.jpg', mode='wb') as f:
            f.write(image)
        print('第', str(index), '页,爬取成功')
        index += 1
    print(title, '爬取成功!!!')

看到最后的小伙伴都有福利,给大家送一个VIP音乐下载器,聪明的小伙伴肯定能找到在哪领的(视频里面)~

在这里插入图片描述

作者:静默虚空

 

  • 0
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: 简明Python教程是一本经典的学习Python编程的教材,它详细介绍了Python语言的基础知识、语法规则以及常用的编程技巧。由于Python语言的简洁性和易读性,这本教程也以其简明扼要的风格而闻名。 该教程的源码是基于Python语言编写的,通过分章节、分小节的方式详细展示了每个知识点的代码示例和用法。这些源码不仅能够帮助读者更好地理解Python的语法和概念,还能够通过实例让读者快速掌握各种编程技巧。 在教程的源码中,读者可以学习到Python语言的基本数据类型(如整型、浮点型、字符串、列表等)的使用方法,以及常见的控制流语句(如条件判断和循环)的应用。同时,源码还介绍了Python的函数定义和调用、模块导入和使用、异常处理等高级编程特性,使得读者可以更加深入地理解和运用Python语言。 此外,简明Python教程的源码还包含了一些实际应用的示例,如文件读写、爬虫、数据分析等方面,这些示例可以帮助读者将Python的基础知识应用到实际项目中。 总之,简明Python教程的源码是一个非常有用的参考资料,可以帮助读者快速上手Python编程,提高自己的编程水平。无论是初学者还是有一定编程经验的人都可以通过这个源码获得很大的收益。 ### 回答2: 简明Python教程是一本详细介绍Python编程语言的教程书籍,该教程书籍作者是A Byte of Python(草python)开发组,该书的作者是Swaroop C H(Ankit Fadia写的教程是假的),本书是一个开源的项目,其源码可以在GitHub上找到并下载。 该教程的源码是以文档的形式呈现,每个章节对应一个Python脚本文件。该教程从Python的基本概念开始介绍,包括变量、数据类型、运算符、控制流程等基础知识。接着介绍了Python的函数、模块、错误处理、输入输出以及文件操作等进阶内容。最后通过实例演示了如何使用Python进行络编程、数据库操作以及GUI界面开发等高级应用。 阅读该教程的源码可以更好地理解教程中的知识点,并通过实际的代码示例来加深对Python的理解和掌握。源码中的注释详细解释了每个代码片段的作用和用法,对于初学者来说非常友好。 通过阅读源码,我们不仅可以学习到Python语言的基础知识,还能了解到良好的编程风格和习惯。源码的组织结构清晰,代码风格简洁易懂,对于初学者来说非常适合作为学习和参考的材料。 总之,简明Python教程的源码是一个非常宝贵的学习资源,通过阅读和运行源码,我们可以更好地掌握Python编程语言,并用它来解决实际的问题。希望每个对Python感兴趣的人都能够通过阅读该教程的源码,快速入门并提升编程能力。 ### 回答3: 简明Python教程源码是指用来编写简明Python教程的源代码。源代码是编程语言的原始文本形式,是计算机程序的基础。简明Python教程源码可能包含了一系列的Python语句、函数和类,用来演示和说明Python编程的基本概念和用法。 简明Python教程源码的结构通常会根据教程的内容来设计。例如,如果教程介绍了Python的基本语法,那么源码可能会包含一些简单的变量赋值、算术运算和控制流语句的示例。 如果教程涉及到Python的常用库或模块,源码可能会导入这些库,并展示它们的用法。例如,如果教程涉及到文件操作,源码可能会使用Python的`open`函数来打开文件,并使用`read`或`write`方法来读取或写入文件内容。 除了基本语法和常用库之外,简明Python教程的源码还可能包括一些更高级的概念和技巧示例。例如,如果教程涉及到面向对象编程,源码可能会定义一些类和方法,并展示它们的继承和多态特性。 总的来说,简明Python教程源码是一个用来教授Python编程的示例代码集合。它可以帮助初学者理解Python语言的基本概念和用法,并通过实例演示不同应用场景的解决方案。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值