python爬取小说并下载_python爬取138看书网小说源码

最新推荐文章于 2023-04-02 09:24:56 发布

weixin_39630909

最新推荐文章于 2023-04-02 09:24:56 发布

阅读量586

点赞数

Python爬虫 138看书网小说源码多线程正则表达式

关键词由CSDN通过智能技术生成

python爬取138看书网小说源码由论坛用户制作并分享，适用于138小说网，能够帮助用户爬取网站获取小说资源，软件提供分类搜索查找的功能，支持目录爬取，还附带书签功能，用户使用这款软件能够更加轻松地看小说，非常实用。

软件说明

记录一下今天爬的第二个小说网，第二次弄起来比较熟练了，不像第一次弄一半就得找教程边看边搞。

但实际上爬小说应该是最简单的事情了吧，涉及的技术也没有那么深。

把代码发出来让想刚入门却不知道从何下手的同萌新们看看吧，看教程总是云里雾里的，还是还得上手多练练才能加深印象。

这个小说爬虫还是有点垃圾，多线程没有，而且有些函数也是用的跟*一样，这玩意该怎么改进也没有头绪。

演示一览

import requests

import lxml

import re

headers = {

'user-agent': 'User-AgentMozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/80.0.3987.132 Safari/537.36'

}

print ('本脚本仅适用于138看书网：https://www.13800100.com/')

#url_list = 'https://www.13800100.com/list/72262/'

url_list = (input('粘贴小说目录url，必须是小说目录，小说首页不支持

'))

downurl = 'https://www.13800100.com/article/'

url_list = requests.get(url_list)

text_list = url_list.text

#爬小说书名

text_title = re.findall(r'

(.*?)',text_list,re.S)[0]

text_title = text_title.replace('

','')

text_title = text_title.replace('

','')

text_title = text_title.replace(' ','')

#爬小说目录列表

text_list_info = re.findall(r'

.*?

',text_list,re.S)[0]

text_list_info = re.findall(r'(.*?)',text_list)

for i in text_list_info:

#每章小说的url和每章章名

list = i[0]

name = i[1]

download = downurl + list

download_info = requests.get(url = download,headers=headers)

html=download_info.text

html_info = re.findall(r'

(.*?)

',html,re.S)[0]

html_info = html_info.replace (' 　　','')

html_info = html_info.replace ('

',('

'))

html_info = html_info.replace ('　　','')

print (name)

#输出为记事本

with open ('%s.txt' % text_title,'a+',encoding = 'utf-8')as f:

f.write(' '+ name + '

')

f.write('

')

f.write(html_info + '

')

f.write('

')

print ('下载完成')

上文就是小编为您带来的python爬取138看书网小说源码了，更多精彩软件请多多关注非凡软件站。

weixin_39630909

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。