词云”这个概念由美国西北大学新闻学副教授、新媒体专业主任里奇·戈登(Rich Gordon)提出。
“词云”就是对网络文本中出现频率较高的“关键词”予以视觉上的突出,形成“关键词云层”或“关键词渲染”,从而过滤掉大量的文本信息,使浏览网页者只要一眼扫过文本就可以领略文本的主旨。
通过数据分析对数据可视化,进而直观的分析得出结果,wordcloud词云是一款强大的工具,下面通过文本提取,分词来实现。
首先安装WordCloud云词库,matplotlib图像库,jieba分词。
安装完成后,我们写个text文本,内容如下:
9月25日-27日,icHub邀您共聚2019印度国际电子展(Electronic India2019)。这是有芯电子第一次正式向海外推出icHub.com平台。icHub.com平台是有芯电子以二十多年积累的国内外元器件分销经验和资源为基础,历经三年开发与投入创建而成。通过用户、商户、账户的三位一体人脉系统管理,icHub致力于“打通供应链最后一公里”,为元器件分销行业提供“SKU精准供求”、“BOM123自动报价”、智能仓储,以及符合CNAS标准的品控检测等供应链信息枢纽服务。
展会期间,光临有芯电子展台,可以进一步了解icHub.com平台,体验BOM智能报价和以人为本的三户系统,近距离感受icHub平台的强大功能和智能化系统。还有机会获取精美礼品。
接下来我们读取文本内容,并统计:
最后生成云图片:
结果可以直观的看到文本分析结果。