python词频统计时、文件放哪里_初学python,词频统计小实验

最近突然对python感兴趣,就学了起来。我可怜的计算机基础只有VB,而且学的时候这门课还特别水,仅仅了解了语法,考试基本上是背题过的。

现在自学python还是比较吃力。今天捣鼓了一下午,搞出了一个词频统计的程序,敲了三四十行代码,还是十分有成就感。本着输出是为了更好的理解知识的初心,我来谈谈我是怎么写的,用的那些方法。毕竟是刚接触的小白,很有地方走了弯路,用的可能不是很好的方法,很多理解上或许有很多偏差。 不过没关系,有大佬指出我错误的地方,我会很感激的;若有同小白的受到了启发,我会很开心的。

先说说词频统计我是怎么想的,用到了什么方法?再谈谈我遇到的困难和展现的实际效果。最后放出我的代码

词频统计肯定是要对字符串进行处理。将英文的单词,中文的词语给拧出来,还要统计他们出现的次数,最后再做个排序,通常是从高到低。英文进行分词不需要用到第三方库,直接使用".spite()"方法进行处理就行了。中文的分词要用到“jieba(结巴)”库,再敲一行代码就可以了。

words = jieba.lcut(txt) #words 是分开的一个一个词的集合,txt是要分词的文本

等等,既然我有两种分词的方式,一个是对英文的,另一个是对中文的,而且要写在一个程序里面。我需要做一个分支结构,谁知道我某天要拿中文还是英文来做词频统计呢?于是我用if else 语句做了一个简单的分支。

print("1.英文单词词频统计。\n2.中文词语频率统计。")

option = input("请选择要进行的词频统计类型&

  • 2
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值