python实现简单的词形统计

最新推荐文章于 2023-08-09 17:15:00 发布

陈多鱼

最新推荐文章于 2023-08-09 17:15:00 发布

阅读量517

点赞数 4

分类专栏：机器学习文章标签： python 正则表达式

本文链接：https://blog.csdn.net/qq_42338771/article/details/113046152

版权

本文介绍了如何使用Python的正则表达式进行简单的词形统计，从需求分析到编码实现，再到调试结果的展示，最后进行了总结。

摘要由CSDN通过智能技术生成

用python正则表达式实现简单的词形统计

需求如下：

在这里插入图片描述

  交流了好长时间才知道她要的是词形统计，如AA.AAB,AABB...

编码如下

import re
from matplotlib import font_manager
import matplotlib.pyplot as plt
import numpy as np
def read_file_gbk(filename):
    with open(filename,'r',encoding='GBK') as f:
        s = f.read()
        s = re.sub('/C', '', s)
        s = re.sub('\r|\n|\s','',s)
    return s
def read_file_utf8(filename):
    with open(filename,'r',encoding='utf-8') as f:
        s = f.read()
        s = re.sub('/C', '', s)
        s = re.sub('\r|\n|\s','',s)
    return s
def dict_sort(dictname):
    dictlist = sorted(dictname.items(),key=lambda x:x[1],reverse=True)
    return dict(dictlist)
def main(</