免费小说下载爬虫

freetxt.py

#coding=utf-8
import requests
import re
print('数据来源于https://www.biqubao.com/ 如需到此网更新书籍')
bookurl = input('该本小说网站(直接回车自动跳转一本):')
if bookurl == '':
    bookurl = 'https://www.biqubao.com/book/34203/'
homeurl =  'https://www.biqubao.com/'
A = requests.get(bookurl).content.decode('gb2312')
B = re.split(r'<dd><a href=|</a></dd>',A)
PAGE = []
for html in B:
    if 'html' in html and '\n' not in html:
        PAGE.append(html)

def page_new(P):
    PP=int(P)-1
    ok = re.split(r'"/|">',PAGE[PP])
    oneurl = homeurl+ok[1]
    print('_'*70)
    print('|'+ok[2]+oneurl)
    D = requests.get(oneurl).content.decode('gb2312')
    E = re.split(r'<br />|&nbsp;&nbsp;&nbsp;&nbsp;|</div>|<h1>|</h1>|\n',D)
    for text in E:
        if text !='' and '<a href=' not in text:
            really = 0
            for i in text:
                if '\u4e00' <= i <= '\u9fff':
                    really +=1
            if  really > 0:
                print('|'+text)
    print('——'*15)
    
textpage = 0
if __name__ == '__main__':
    while True:
        old = textpage
        textpage = input('跳转书页|回车下一章next>>')
        if textpage == '':
            textpage = int(old) +1
        page_new(textpage)

文档:freetxt.exe
链接:http://note.youdao.com/noteshare?id=11eeac80bf7f4570a087ae850f9ea4e1

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

isSamle

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值