导入jieba
win+r 输入
pip install jieba
或
pip3 install jieba
注意不能使用IDLE
由于是外网可能会下载失败,可以尝试这个指令
pip install -i https://pypi.tuna.tsinghua.edu.cn/simple jieba
如果无效可以尝试下载到本地安装
安装成功后win +r输入
pip list
寻找有没有jieba,如果看到jieba,恭喜你安装jieba库成功
实例(Python词频统计)
1.导入jieba库
2.打开secretletter
3.利用jieba.lcut统计词频
4.使用字典counts进行统计重复字符个数
5.将字典counts转换成列表items
6.对items排序
7.遍历输出items
import jieba
#打开文件,根据自己的文件的地址写对应路径
txt = open("python\\secretletter.txt","r",encoding='utf-8').read()
words = jieba.lcut(txt)
#利用字典counts统计重复次数
counts = {}
for word in words:
if len(word) == 1:
continue
else:
counts[word] = counts.get(word,0) + 1
#字典转换成列表排序
items = list(counts.items())
#对列表的第二个字段排序,reverse=True为降序(从大到小,不写“reverse = True”某认升序)
items.sort(key = lambda x:x[1],reverse = True)
#列出前15个
for i in range(15):
word,count = items[i]
print("{0:<10}{1:>5}".format(word,count))