Python爬虫——动漫zj（manhua站）

最新推荐文章于 2024-05-25 17:04:29 发布

正义的反派人士

最新推荐文章于 2024-05-25 17:04:29 发布

阅读量1.7k

点赞数 4

分类专栏：爬虫

本文链接：https://blog.csdn.net/qq_35353137/article/details/82973115

版权

1，使用到的库

from urllib.parse import urlencode
import requests
import re
import json
import execjs
from bs4 import BeautifulSoup
from pymongo import MongoClient
import os

2，大致步骤

根据漫画名称获取漫画url
根据漫画url获取漫画每一话的url
获取每一话所有的图片url
将url及其相关信息存入MongoDB
成功请求每个url，加载出图片再将其下载到本地

3，注意点

步骤一中，漫画的url并不在返回的页面shtml中，而是存在异步加载出的search.php

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

正义的反派人士

关注关注

4
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
Python爬虫——动漫zj（manhua站）

目录 1，使用到的库2，大致步骤3，注意点4，具体代码实现1，使用到的库from urllib.parse import urlencodeimport requestsimport reimport jsonimport execjsfrom bs4 import BeautifulSoupfrom pymongo import MongoClient...
复制链接

扫一扫