一次下载的小说txt章节优化记录

缘由:

在线阅读小说有时候因为网络等因素,造成章节不能及时刷新出来,因此经过一番百度,把小说章节下载了下来,但是 章节是错乱的,且参杂很多网站水印,阅读起来挺难受的,因此 优化一下吧。

首先放图:

调整前:

调整后:

嗯~ 看起来顺眼多了 

首先打开原始小说,查找要调整的地方,依据小说文本的规则进行调整 即可

首先看原始txt

1. 每个章节 都是阿拉伯数字 + 顿号 + 章节标题 组成
2. 每个章节 结尾都包含两行网站水印

3. 经过全局搜索 部分内容 参杂 xxx.com 内容

经过判断解决以上问题 即可

操作步骤:

1. 读取 按行读取原始内容
2. 替换
       2.1 替换章节

       2.1.1 判断以阿拉伯数字开头 且 包含 顿号 且 包含 (xxx.com) 的行内容

       2.1.2 替换 (xxx.com) 为空

       2.1.3 写一个阿拉伯数字 转 一二三的函数

       2.1.4 组合 第 + 一二三 + 章 + 章节标题 + 换行符

      2.2 替换章节结尾水印

        2.2.1  判断行内容 大致包含结尾水印内容 替换为空 

      2.3 替换部分html 内容

        2.3.1 判断行内容 大致包含xxx.html  替换为空

3. 写入

        3.1 创建新的txt, 按行写入即可,数据量大的可以使用 缓存或者分批操作

        

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值