python txt文件去除数字字母只保留中文

# -*- coding: utf-8 -*-
# @Time : 2022/11/2 11:22
# @Author : xxxd39
# @FileName: DelNUMstr.py
# @Software: PyCharm
# @Blog :https://blog.csdn.net/weixin_33595571?type=blog
import re


def del_number(string):
    ls = []
    for c in string:
        ls += [c not in [str(i) for i in range(10)] and c or '']
    return ''.join(ls)


# 获取file_path路径下的所有TXT文本内容和文件名
def get_text_list(file_path):
    f = open(file_path, encoding='gbk')
    return f.read()

print('请将要删除数字以及英文字符的文件保存为D:\\1.txt文件')
print('过滤完成后文件会保存为D:\\2.txt文件')


text_list = get_text_list('D:/1.txt')
print(text_list)
result = re.sub(u"([^\u4e00-\u9fa5\u0030-\u0039\u0041-\u005a\u0061-\u007a])", "", text_list)
chinese = ''.join(result)
strChinese = del_number(chinese)
print(strChinese)
path2 = r'D:\2.txt'
file2 = open(path2, 'w+')
file2.write(strChinese)
file2.close()

a = input('请输入任意字符开始:')

  • 2
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值