python 3.7学了一段时间,试着写个小程序检验,巩固一下。
准备
使用pip注意事项
- 必须以管理员身份运行cmd;
- pip命令大小写敏感;
- 最好指定国内源镜像加快下载速度
安装jieba
pip install -i https://pypi.tuna.tsinghua.edu.cn/simple some-package
参考清华大学开源软件镜像站
读取文件,并使用jieba分词
with open("seg_test.txt", 'r', encoding='UTF-8') as f:
novel_segm = jieba.lcut(f.read())
利用Counter来统计词频
counter_result = collections.Counter(novel_segm) # 返回字典
从以上结果里删去对单个字的统计