统计中文句子中的词频

最新推荐文章于 2021-01-25 21:06:21 发布

是菓子呀

最新推荐文章于 2021-01-25 21:06:21 发布

阅读量789

点赞数 1

分类专栏： # 南京大学-张莉-《用Python玩转数据》

本文链接：https://blog.csdn.net/weixin_46430524/article/details/104873839

版权

该博客介绍了如何利用Python的collections.Counter函数统计已分词的中文句子中的词频，并提供了一个例子展示如何通过字典实现同样的功能。博主强调了在实际应用中，可以方便地扩展到统计文件中的词频。

摘要由CSDN通过智能技术生成

题目内容：

对于一个已分词的句子（可方便地扩展到统计文件中的词频）：

我/是/一个/测试/句子/，/大家/赶快/来/统计/我/吧/，/大家/赶快/来/统计/我/吧/，/大家/赶快/来/统计/我/吧/，/重要/事情/说/三遍/！

可以用collections模块中的Counter()函数方便地统计词频，例如可用如下代码：

import collections
import copy
s = "我/是/一个/测试/句子/，/大家/赶快/来/统计/我/吧/，/大家/赶快/来/统计/我/吧/，/大家/赶快/来/统计/我/吧/，/重要/事情/说/三遍/！/"
s_list = s.split('/') 
# 为避免迭代时修改迭代对象本身，创建一个列表的深拷贝，也可用浅拷贝s_list_backup = s_list[:]
s_list_backup = s_list[:]
[s_list.remove(item) for item in s_list_backup if item in '，。！”“']
collections.Counter(s_list)

这个问题也可以通过字典来解决，请编写用字典解决本问题的程序，为便于OJ系统自动判断，程序最后输出某个单词的词频。

程序参考框架

def countfeq(s):
   ... ...
   return a dict
    
if __name__ == "__main__":
   s = "Not clumsy person in this world, only lazy people, only peo

最低0.47元/天解锁文章

是菓子呀

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
1
评论
统计中文句子中的词频

题目内容：对于一个已分词的句子（可方便地扩展到统计文件中的词频）：我/是/一个/测试/句子/，/大家/赶快/来/统计/我/吧/，/大家/赶快/来/统计/我/吧/，/大家/赶快/来/统计/我/吧/，/重要/事情/说/三遍/！可以用collections模块中的Counter()函数方便地统计词频，例如可用如下代码：import collectionsimport copys = "我/是...
复制链接

扫一扫