文本词频

最新推荐文章于 2023-12-01 15:39:30 发布

lia仔

最新推荐文章于 2023-12-01 15:39:30 发布

阅读量655

点赞数

分类专栏：笔记

本文链接：https://blog.csdn.net/weixin_50510915/article/details/109624172

版权

笔记专栏收录该内容

1 篇文章 0 订阅

订阅专栏

用python会简单一点

def newdic(dicts,n):
    list1 = sorted(dicts.items(),key=lambda x:x[1])
    return list1[-1:-(n+1):-1]

f = open(r"E:\VS Code\us_constitution.txt","r", encoding="utf-8").read()
txt = f.lower().split()

dic = {}
for word in txt:
    if word in dic:
        dic[word] = dic[word]+1;
    else:
        dic[word]=1
del [dic['the'],dic['of'],dic['be'],dic['or'],dic['my'],dic['i'],dic['and'],dic['in'],dic['a'],dic['by'],dic['for'],dic['which'],
     dic['any'],dic['such'],dic['as'],dic['have'],dic['on'],dic['he'],dic['is'],dic['from']]
print(newdic(dic,100))`

删除一些连接词之类的词汇，用了很傻很暴力的方法

对于C实现的一些想法：
由于无法预知存在多少词汇，所以动态分配是要的
类比python的dict，创建一个类似的结构体存放单词及相应的词频

结构体流程图

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

lia仔

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
2
评论
文本词频

![在这里插入图片描述![](https://img-blog.csdnimg.cn/20201111153524172.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3dlaXhpbl81MDUxMDkxNQ==,size_16,color_FFFFFF,t_70)
复制链接

扫一扫