漫画爬虫

本文介绍了如何使用爬虫技术抓取漫画网页的内容,清除无关信息,并将每一话的图片整合到单独的页面上,实现漫画阅读的便捷体验。
摘要由CSDN通过智能技术生成
import requests
import flask
#############################################
def 打开漫画(漫画目录网址):
    目录页面=requests.get(漫画目录网址)
    目录页面.encoding="utf-8"
    目录=[]
    开始关键词='<div class="chapter-body clearfix">'
    a1=目录页面.text.find(开始关键词)+len(开始关键词)
    a=a1
    z=目录页面.text.find('</div>',a)
    print(目录页面.text)
    while a<z and a>=a1:
        b=目录页面.text.find('href="',a)+len('href="')
        c=目录页面.text.find('"',b)
        d=目录页面.text.find('<span>',c)+len('<span>')
        a=目录页面.text.find('<',d)
        print(目录页面.text[b:c],目录页面.text[d:a])
        目录.append([目录页面.text[b:c],目录页面.text[d:a]])
    return 目录
def 打开目录(目录链接):
    目录=[]
    目录页面=requests.get(目录链接)
    目录页面.encoding="utf8"
    开始关键词='按剧情'
    a=目录页面.text.find(开始关键词)+len(开始关键词)
    z=目录页面.text.find('</div',a)
    while a<z and a!=-1:
        b=目录页面.text.find('<li>',a
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值