lesson 1:词云图
实现功能:
- 文本信息可视化
- 统计高频词,揭示文本主旨。
python实现思路及代码:
- 分词
- 词频统计
- 生成词云图
# 分词
import jieba
with open('China145.txt','r',encoding='utf-8') as f:
remain = f.read()
jieba.load_userdict('AIDict.txt') # 添加自定义字典
seg_list=jieba.cut(remain,cut_all=False)
# 统计词频 至字典tf
tf={
}
for seg in seg_list:
if seg in tf:
tf[seg]+=