练习1-高端又一般的词云

环境:Ubuntu+python3.6+jupyter notebook
教材:高端又一般的词云

词云目的是为了将权重占比高的词语重点显示,从而突出文本内容。
代码如下:将西游记的内容勾画出词云

!pip install wordcloud jieba

# -*- coding: utf-8 -*-

from wordcloud import WordCloud
import matplotlib.pyplot as plt
import jieba

text = open('xyj.txt').read()

text = ' '.join(jieba.cut(text))
print(text[:100])

wc = WordCloud(font_path='Hiragino.ttf', width=800, height=600, mode='RGBA', background_color=None).generate(text)

plt.imshow(wc, interpolation='bilinear')
plt.axis('off')
plt.show()

在这里插入图片描述

函数解析

WordCloud:接收文本 并 将文本内容转化为词云对象 (但是注意 因为主要是面向英语 英语的词是用空格分开的 所以如果对中文使用的话 必须先用空格将一段话拆成词语)
比如:“I am your father” 而中文是"我是你爸爸" 这一句话都是词语

text = ’ '.join(jieba.cut(text)) 会将"我是你爸爸" 改为 “我 是 你 爸爸” 这才是中文词语

错误问题与解答

词云(wordcloud)报错:ValueError: We need at least 1 word to plot a word cloud, got 0.
解决办法:文件格式改为utf-8保存即可

OSError: unknown file format
解决办法:我是Ubuntu的环境映射到windows的,所以先把ttf文件放到ubuntu下,不要直接拉到Jupyter中

  • 5
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值