Python 正则表达式：把一篇文章处理为一句话一行

东枫科技

于 2020-04-13 09:41:05 发布

阅读量815

点赞数 2

分类专栏： Python

本文链接：https://blog.csdn.net/qq_36666115/article/details/105481870

版权

Python 专栏收录该内容

53 篇文章

订阅专栏

本文介绍了一种使用Python和正则表达式从文本中提取中文字符的方法。通过打开并读取文件，利用正则表达式的模式匹配，能够有效地筛选出所有中文字符，并将这些字符写入新的文件中。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

#!/usr/bin/env python
# -*- coding: utf-8 -*-
import re

f1=open("outout1.txt","w+",encoding='utf-8')
import codecs
with codecs.open("output.txt", 'r', encoding='utf-8',errors='ignore') as fdata:
    Str = fdata.read()
    pattern =re.compile(u"[\u4e00-\u9fa5]+")
    result=re.findall(pattern,Str)
    for w in result:
        f1.write(w+"\n")
    #print ("---",w)
    f.close()