实验五:三国演义词云图
“词云”就是对网络文本中出现频率较高的“关键词”予以视觉上的突出, 形成“关键词云层”或“关键词渲染”,从而过滤掉大量的文本信息,使浏览网 页者只要一眼扫过文本就可以领略文本的主旨。
实验目的:
- 熟悉文件的读取
- 熟悉中文分词及词频统计
- 理解数据清洗
- 熟练使用词云进行文本信息的展示
- 理解文本处理、文本分析、文本可视化的基本思想 实验内容:
编写程序,找出《三国演义》这本小说的人物关键词,并对“关键词渲染” 形成词云图。
实验要求:
在提供的文本中选择其中的一个文本,提取关键词,并对“关键词渲染” 形成词云图。
import matplotlib.pyplot as plt
import jieba
from wordcloud import WordCloud
txt = open('threekingdoms.txt', 'r', encoding='utf-8').read()#记得放在目代码同一路径的文件夹
print(txt)
words = jieba.lcut(txt)#返回一个列表类型txt表示变量名
counts = {
}
for word in