《论语》文本分析

该博客介绍了如何使用Python读取'论语.txt'文件,通过正则表达式和字符串操作,首先筛选出原文部分,并移除不必要的注释格式,然后进一步清理原始文本,删除所有括号内的数字。展示了文本处理的基本技巧。
摘要由CSDN通过智能技术生成

题目描述

在这里插入图片描述
内容如下:
在这里插入图片描述

问题1

在这里插入图片描述

代码实现

fi = open("论语.txt","r")#以读的模式打开
fo = open("论语-原文.txt","w")#由于要进行保存,所以进行创建并且是写的模式
flag=False
for line in fi:
    if "【注释】" in line:
        flag=False
    if "【原文】" in line:#判断是否为原文的内容
        flag=True#进行标记方便输出
        continue#是原文内容,那就继续遍历下一行
    if flag==True:
       fo.write(line.lstrip())
fi.close()
fo.close()

问题2

在这里插入图片描述

代码实现

fi = open("论语-原文.txt","r")
fo = open("论语-提纯原文.txt","w")
for line in fi:
    for i in range(1,23):
        line=line.replace("({})".format(i),"")#用空来替换出现的(数字)这种形式
    fo.write(line)
fi.close()
fo.close()

说明:
line.replace(old,new,max)–>将原来想要替换的(old)替换为想要替换的(new),其中max为替换的次数,默认的话是替换所有的。

在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

工程人永远在路上

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值