python词频统计时、文件放哪里_初学python，词频统计小实验

最新推荐文章于 2024-05-24 00:55:28 发布

weixin_39765339

最新推荐文章于 2024-05-24 00:55:28 发布

阅读量1.9k

点赞数 2

文章标签： python词频统计时、文件放哪里

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_39765339/article/details/111426820

版权

最近突然对python感兴趣，就学了起来。我可怜的计算机基础只有VB，而且学的时候这门课还特别水，仅仅了解了语法，考试基本上是背题过的。

现在自学python还是比较吃力。今天捣鼓了一下午，搞出了一个词频统计的程序，敲了三四十行代码，还是十分有成就感。本着输出是为了更好的理解知识的初心，我来谈谈我是怎么写的，用的那些方法。毕竟是刚接触的小白，很有地方走了弯路，用的可能不是很好的方法，很多理解上或许有很多偏差。不过没关系，有大佬指出我错误的地方，我会很感激的；若有同小白的受到了启发，我会很开心的。

先说说词频统计我是怎么想的，用到了什么方法？再谈谈我遇到的困难和展现的实际效果。最后放出我的代码

词频统计肯定是要对字符串进行处理。将英文的单词，中文的词语给拧出来，还要统计他们出现的次数，最后再做个排序，通常是从高到低。英文进行分词不需要用到第三方库，直接使用".spite()"方法进行处理就行了。中文的分词要用到“jieba(结巴)”库，再敲一行代码就可以了。

words = jieba.lcut(txt) #words 是分开的一个一个词的集合，txt是要分词的文本

等等，既然我有两种分词的方式，一个是对英文的，另一个是对中文的，而且要写在一个程序里面。我需要做一个分支结构，谁知道我某天要拿中文还是英文来做词频统计呢？于是我用if else 语句做了一个简单的分支。

print("1.英文单词词频统计。\n2.中文词语频率统计。")

option = input("请选择要进行的词频统计类型&

最低0.47元/天解锁文章

weixin_39765339

关注

2
点赞
踩
9

收藏

觉得还不错? 一键收藏
0
评论
python词频统计时、文件放哪里_初学python，词频统计小实验

最近突然对python感兴趣，就学了起来。我可怜的计算机基础只有VB，而且学的时候这门课还特别水，仅仅了解了语法，考试基本上是背题过的。现在自学python还是比较吃力。今天捣鼓了一下午，搞出了一个词频统计的程序，敲了三四十行代码，还是十分有成就感。本着输出是为了更好的理解知识的初心，我来谈谈我是怎么写的，用的那些方法。毕竟是刚接触的小白，很有地方走了弯路，用的可能不是很好的方法，很多理解上或许有...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。