目录
1,使用到的库
from urllib.parse import urlencode import requests import re import json import execjs from bs4 import BeautifulSoup from pymongo import MongoClient import os
2,大致步骤
- 根据漫画名称获取漫画url
- 根据漫画url获取漫画每一话的url
- 获取每一话所有的图片url
- 将url及其相关信息存入MongoDB
- 成功请求每个url,加载出图片再将其下载到本地
3,注意点
- 步骤一中,漫画的url并不在返回的页面shtml中,而是存在异步加载出的search.php