汉字断句的方式。

import re
import jieba
text = """
心中,那个月亮弯,停泊着历史的古船,沉淀着文化的靛蓝,静静地,为你守盼,那份真实的灿烂。--题记

很喜欢一个人捧着茶杯品茶的感觉。渐渐西斜的残阳,一抹霞红穿透剔亮的玻璃,掩映着书房里一排排古色发黄的线装书。一腾热气冲淡了黄昏,凝缩的那份脆干的青绿在热水中翻跃,升腾,一旦浸润了湿,就贪婪地吮吸久违的甘露,伸伸懒腰,缓缓的,蹬蹬腿,在古铜色的花杯中舒展开久封的筋骨。于是,脉胳渐显了,青绿在热水中延散了,一片片风干的茶叶在浸润中寻到了绿的真实,回到了曾在树枝上招摇的青春与真实,清清的,露珠,泥土的味道弥漫在小屋,一份还真带来的醉香荡漾在心头。

因为品茶,因为爱真,谈及历史,谈及文化,也守着不变的概念--真。

我的书架上有着古老而真实的文化,明刻本,线装书,发黄的记忆,永久的思索,不管春温秋肃,还是大喜悦大悲愤,捧起一本原版古书,放在心头,最后总得要闭一闭眼睛,平一平心跳,回归于历史的冷漠,理性的严峻,从一页页几欲风干的书页中,我品到了一份历史的真实,文化的真实。
"""
# 根据标点符号分割句子
sentences = re.split('[,。!?;]', text.strip())

# 对句子进行长度判断
max_len = 10
new_sentences = []


for sentence in sentences:
    if len(sentence) > max_len:
        # 如果句子长度大于10,则将句子分成两段不影响阅读
        cut_res = list(jieba.cut(sentence, cut_all=False))
        cut_len_mid=len(cut_res)//2
        new_sentences.append(''.join(cut_res[:cut_len_mid]))
        new_sentences.append(''.join(cut_res[cut_len_mid:]))
        # new_sentences.extend(sub_sentences)
    else:
        new_sentences.append(sentence)
for x in new_sentences:
    print(x)

可行。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

PyAIGCMaster

1毛钱也是爱

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值