政府工作报告词云

1.读取文件,分词整理
2.设置并输出词云
3.观察结果,优化迭代
安装wordcloud库,用pip install wordcloud命令安装,下载好需要分析的文件并保存为utf-8编码.txt格式

代码如下:

import jieba
import wordcloud
f = open("新时代中国特色社会主义.txt","r",encoding="utf-8")
t = f.read()
f.close()
ls = jieba.lcut(t)
txt = " ".join(ls)
w = wordcloud.WordCloud(font_path = "msyh.ttc",
                        width = 1000,height = 700,background_color ="white")
w.generate(txt)
w.to_file("grwordcloud.png")

还可以扩展成为不规则的图云,这里用到mask指定词云形状

import jieba
import wordcloud
from scipy.misc import imread
mask = imread("chinamap.jpg")   #基于本图片指定的特殊词云形状
f = open("新时代中国特色社会主义.txt","r",encoding="utf-8")
t = f.read()
f.close()
ls = jieba.lcut(t)
txt = " ".join(ls)
w = wordcloud.WordCloud(font_path = "msyh.ttc",
                        width = 1000,height = 700,background_color ="white",
                        mask = mask)
w.generate(txt)
w.to_file("grwordcloud.png")

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Echarts词云是一种数据可视化工具,可帮助我们展示文本数据中关键词的频率和重要性。通过将词汇以不同的字体大小和颜色展示在图表上,能够更直观地呈现词语的权重和关联性。 使用Echarts词云,首先需要准备好待展示的文本数据。然后,根据数据的特点,我们可以设置不同的参数来调整词云的表现形式。比如,我们可以通过设置字体大小、颜色、形状等来突出显示词汇的重要性,也可以设置过滤词、布局方式等来控制词云的整体效果。 导入数据后,我们需要使用Echarts提供的词云组件将数据转换成词云图形。词云组件支持设置各种参数,包括词云形状、字号范围、词语间距、旋转角度、过滤词和文本样式等。其中,常用的参数有: 1. 数组data:代表词云中的文本数据,其中每一项包含词汇和词频,用于显示在词云上。 2. 字号范围:可以通过设置minSize和maxSize来指定词汇的字号区间。词频高的词汇会显示为较大的字体大小,词频低的词汇会显示为较小的字体大小。 3. 过滤词:可以通过设置stopWords参数来指定一些不需要显示的常用词汇,如“的”、“是”等。 4. 布局方式:可以通过设置gridSize、shape等参数来控制词语的排列方式和形状。 除了以上常见的参数,Echarts词云还支持添加交互功能,如鼠标悬浮显示词汇详情、添加点击事件等。 总而言之,Echarts词云是一种直观、美观且易于使用的数据可视化工具,能够帮助我们更好地理解和分析文本数据中的关键词。无论是用于展示新闻标题、用户评论、市场调研数据等,都能提供直观的视觉效果,方便我们从大量的文本数据中提取关键信息和洞察现象。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值