PHP处理小说文章内容

本文讲述了使用PHP处理GBK格式的小说文本,通过转换编码、正则匹配章节标题,将小说章节分割成单独的UTF8文件的过程。遇到的困难包括正则匹配汉字章节标题及内容的分割,最终通过调整正则表达式和利用array_unique去重实现了功能。
摘要由CSDN通过智能技术生成

PHP处理小说章节并分割成文件

 

先缕清思路,

拿到一个超大TXT小说之后能干什么、是不是得按照章节给逐个分清各个小文件

 

之前我是这样想的,用正则匹配每个章节,把内容里的章节全给匹配到,再放到数组遍历用explode给逐个分割,每一章对应生成每一章的文件。开始干吧

 

 

if(preg_metch(“/[0-9一二两三四五六七八九十百千万]*[章节]/i”,$str,$matches){}

但是这样匹配不到,我上网查了一下,正则匹配得是UTF8格式的 小说一般都是

  • 3
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 3
    评论
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值