好无聊啊~ 来试试用Python采集下载漫画【附原码哟~】

最新推荐文章于 2024-04-18 00:05:00 发布

苏南Python~

最新推荐文章于 2024-04-18 00:05:00 发布

阅读量335

点赞数 1

分类专栏： Python 文章标签： python 开发语言爬虫

本文链接：https://blog.csdn.net/sunanpython/article/details/128302594

版权

本文介绍了如何使用Python进行漫画数据的采集，涵盖了爬虫基本流程、数据保存、requests库和base64解码等知识点。通过实例代码演示了发送请求、解析数据和保存漫画的过程。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

前言

嗨嗨，大家好~

前段时间看小说看的上头，现在有点腻了，开始看漫画了

今天就来用Python采集一下漫画吧

就随便爬一个，大家搞清楚思路后，可以自己去采集自己喜欢看的漫画哦

知识点:

爬虫基本流程
保存海量漫画数据
requests的使用
base64解码

开发环境:

版本：python 3.8
编辑器：pycharm
requests: pip install requests
parsel: pip install parsel

如何安装python第三方模块:

win + R 输入 cmd 点击确定, 输入安装命令 pip install 模块名 (pip install requests)回车
在pycharm中点击Terminal(终端) 输入安装命令

实现代码:

发送请求
获取数据
解析数据
保存数据

代码

import base64
import requests
import re
import json
import parsel
import os

# 伪装
headers = {
   
    # 用户信息
    'cookie': '__AC__=1; tvf....

请添加图片描述

原码.点击即可领取【备注：苏】

select = pa

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

苏南Python~

关注关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

10994部漫画信息，用Python实施大采集，因为反爬差一点就翻车了

梦想橡皮擦，专栏100例写作模式先行者，现象级专栏《Python 爬虫 100 例》作者、《滚雪球学 Python 专栏》原创者

06-27

1万+

擦哥说这网站不正经~

用python爬取漫画，代入感太强了

a55656aq的博客

12-24

4472

导语：哈喽，哈喽~当有人给你安利了一部超级好看的漫画时。你点进去看了一下，这画风，这剧情，代入感太强我现在宣布我就是女主了。但是看着看着，要vip你又没有，这是什么人间疾苦啊！我的女主光环呢？正文：下面小编使用python爬取漫画，此次代码以一个小型的网站来作为练手，其他的和该思路差不多大致相同，仅供参考。 https://m.gufengmh8.com/ 打开这个网址后，让我们点击搜索进行相关的漫画搜索。截图为搜索页面，可以看到网址为： https:/..

参与评论您还未登录，请先登录后发表或查看评论

python实战案例：采集某栈漫画数据，免费看完本

2301_76201613的博客

02-22

756

前言漫画是什么？丰子恺说：“漫画是简笔而注重意义的一种绘画。如今漫画深受大众喜欢，今天我们就来采集一下漫画数据吧，免费看完本环境使用:Python 3.8及Pycharm模块使用:pip install requests 数据请求模块parsel >>>pip install parsel 数据解析模块基本思路流程: 二. 代码实现步骤获取章节ID/章节名字/漫画名字:请求链接: 漫画目录页url获取数据, 获取服务器返回响应数据。

有点无聊，来试试用Python采集下载漫画

kakA的博客

11-11

1620

又是掌握知识的一天

用Python下载漫画，每天掌握一个实用知识

aliYz的博客

11-03

2227

有点无聊就爬漫画

ZERO网络漫画采集助手[免费软件]C#演示版0.2.1

【Java究竟怎么玩?】

11-23

3963

近段时期来，由于各漫画站点广告量的不断增加，严重的影响到吾辈的漫画浏览速度与质量，所以最近业余在单位开发了这个小软件……（就是ZERO小说助手的内核，改成浏览图片而已，基本不花时间）本软件的最大特色是，会自动分析网站图书-〉分卷-〉漫画页的对应路径，支持缓冲或直接下载至对应路径，不受浏览器脚本限制，能任意下载或浏览所有非服务器限定页面，并且以统一的规格完成网络漫画浏览等操作，消除了不同站点间的操

Python爬虫——漫画下载

山阴少年

08-25

4455

Python爬虫——动漫下载

【Python】用Python做个学生管理系统，可以用作毕业设计哟~（附原码）

sunanpython的博客

12-11

819

今天的分享到这里就结束了对文章有问题的，或者有其他关于python的问题，可以在评论区留言或者私信我哦。

python学习基础游戏原码，用于学习巩固python语法知识

04-08

python学习小游戏原码：中国象棋.zip 元宵节猜灯谜软件.zip 单机版塔防游戏.zip 坦克大战.zip 大富翁.zip 天天酷跑源码.rar 小鸟管道.zip 扫雷小游戏.zip 植物大战僵尸.rar 消消乐.zip 演唱会门票代码.rar 用户视频...

PYTHON之Django Web框架源码下载

03-10

Django框架是Python编程语言驱动的一个开源模型-视图-控制器（MVC）风格的Web应用程序框架。使用 Django，我们在几分钟之内就可以创建高品质、易维护、数据库驱动的应用程序。 Django框架的核心组件有： 1、用于...

【Python】实现一个小说下载器，可以打包成exe（附原码）

sunanpython的博客

12-11

1327

闲的无聊，现在没得什么好剧追（你们或许可以给我推荐推荐）朋友都在看小说，那我就来用Python搞一个小说下载器吧顺便打包一下今天的分享到这里就结束了对文章有问题的，或者有其他关于python的问题，可以在评论区留言或者私信我哦。

Python-由Python编写的全异步实现的动漫之家dmzj漫画批量下载器爬虫

08-12

这是一个使用Python3编写的动漫之家的漫画批量下载器。相比于我之前所写过的几个爬虫，这个爬虫也是我第一次尝试全异步实现的一个爬虫例子，使用了aiohttp和aiofile这两个异步实现库来做支撑，相对于单线程爬虫和多线程爬虫

通用网络小说，漫画采集器

03-09

基于hellodata v1.3开发，下载地址：https://github.com/xiaose1205/HelloData，通用的采集方式，数据库为sqlSQLServer，可以全网扫描书本，可自定义扫描深度，采集方式。

Python下载漫画

weixin_30413739的博客

11-05

296

上午起来提不起劲，于是就用电脑看漫画，但是在线看漫画好烦，就想下下来看。一个一个点太麻烦，于是花了点时间用python写了个demo，把爱漫画的漫画下载下来，这样就可以随时随地看了。这也是我首次尝试用python写不是数据处理的东西，还是很开心的。做的具体思路就是利用python提供的urllib,urllib2的内容来做的，其中辅助了正则表达式模块re，用来进行匹配。因为自己水平不咋...

Python爬取腾讯动漫全站漫画详细教程（附带源码）(1)，项目实践心得体会

最新发布

m0_60667010的博客

04-18

887

运行之后会自动打开漫画的内容页，并拖动右侧的滑动条（模拟了手动操作，缓慢拖动是为了让图片充分加载），其中的sleep方法和网速有一定的关系，网速好的可以适当减少延时的时间，网速差可适当延长。Python所有方向路线就是把Python常用的技术点做整理，形成各个领域的知识点汇总，它的用处就在于，你可以按照上面的知识点去找对应的学习资源，保证自己学得较为全面。首先我们知道通过正常的方式没有办法请求到所有的图片地址信息，若是使用抓包方法会变得非常难分析，所以我采用的是模拟浏览器滑动的方法来获得图片的地址信息。

python爬漫画（2）—— 爬取简单动态加载网页的图片

RikkaTakanashi的博客

11-24

2622

系列之二——爬取动态加载网页的图片在上一篇中我们提到了如何爬取静态网页，静态网页方便爬取是因为我们查看网页元素然后直接爬取信息就可以。然而动态网页比如常见的js动态生成，用静态方法访问网站并且获取html时，js动态生成的这一部分还没有生成，所以静态方法获取不了这一部分信息。我采用的例子是动漫之家（仅学习用，若涉及侵权请联系我，我会下架本文章）我使用的是selenium的we...

从零开始写Python爬虫：漫画批量下载

WANGJUNAIJIAO的博客

02-23

950

数据筛选：随便找一个漫画点进去看看：

python下载漫画

cceking的博客

07-26

4023

下载漫画的脚本身为漫画迷，一直想直接将漫画下载到电脑上看，于是就有这个python脚本。系统：Ubuntu 14.04 python版本：2.7.6 用到的python库有： os （操作系统接口的标准库，用于创建文件） sys （标准库，获取命令行参数） string （字符串操作的标准库，用于将字符串中的数值转换为整型） getopt （对命令行参数进行处理） lxml （当中的html，相

（已更新）漫画小程序，自动采集资源，漫画源码简单即可发布

weixin_70437515的博客

06-19

1038

运行环境：php小程序域名需配置ssl全开源，源码均可更改注意：本源码漫画数据采集于网络，后台仅为一个php文件，控制前端等基本配置小程序源码下载地址：