用python对一段下载的语料库进行词频统计

最新推荐文章于 2023-01-17 12:40:41 发布

啾啾七七

最新推荐文章于 2023-01-17 12:40:41 发布

阅读量3.6k

点赞数 4

分类专栏： python自然语言处理

本文链接：https://blog.csdn.net/wawj9393/article/details/78494705

版权

这篇博客记录了作者使用Python3对下载的语料库进行词频统计的过程，旨在解决老师布置的任务。代码适用于Python3环境，若在Python2环境下运行可能需要调整部分引用。

摘要由CSDN通过智能技术生成

老师布置的统计一段语料库中的几个词的词频，百度了很多资料但是始终找不到最符合自己想要的答案，在这里记录一下，希望以后可以督促自己继续努力。这里的代码在python3下可以运行，在python2下面的话注意更改一些必要的引用。

# coding=utf-8            设定编码形式
import  re                #包含正则表达式
import codecs
dict = {}
z = re.compile(u'[\u4e00-\u9fa5]+')#

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

关注关注