树莓派Raspbian:Python3生成词云图

在某乎上发现一篇非常棒的文章: https://zhuanlan.zhihu.com/p/32891779,关于使用Python制作词云图。全文思路清晰、行文流畅,深入浅出的演示了整个过程,看罢忍不住自己也想照虎画个喵。树莓派正合适啊,Python都是买就送的标配。

手头正好有一份A股上市公司的全部主营产品名称的资料,用这个素材看看天朝上市公司的产品类别娱乐下大概也是件有意思的事情。

准备工作:
sudo apt-get update
sudo apt-get upgrade

文章里提到了jieba分词和wordcloud词云,可以用pip3安装:
sudo pip3 install jieba
sudo pip3 install wordcloud

装起来可能有点慢。耐心,耐心。。。尤其是wordcloud,可能还会报错,试着再次安装,重装到成功为止。

自定义分词和停词的解释原文说的挺好了,这里不多说了。

分词文件里我选了这些词:

房地产
销售
系列
产品
类
stopwords网上找了一个下载,自己再加了几个:
系统
产品
服务
业务
开发
系列
相关

代码:

#coding=utf-8
import jieba
from wordcloud import WordCloud

ftext = open('./a.txt')
text = ftext.read()
ftext.close()

f = open("./stopwords.txt")
stopwords = {}.fromkeys(f.read().split("\n"))
f.close()

jieba.load_userdict("./jieba_cut.txt")

segs = jieba.cut(text)
rst = []

for seg in segs:
    if seg not in stopwords and seg != " " and len(seg) != 1:
        rst.append(seg.replace(" ",","))
        
cloudtext = ",".join(rst)

#print(cloudtext)

wc = WordCloud(
    background_color="white",
    max_words=120,
    font_path="/usr/share/fonts/truetype/wqy/wqy-zenhei.ttc",
    min_font_size=12,
    max_font_size=66,
    width=640,
    height=480
    )
wc.generate(cloudtext)
wc.to_file("./demo.png")
理论上这样应该就可以了,之前也确实能运行。但昨天重装系统之后按上述步骤执行后报错:
RuntimeError: module compiled against API version 0xc but this version of numpy is 0xa
这就是传说中的版本控制问题? 用numpy.__version__看了下是1.12。网上查了很久,发现一个解决办法:
sudo apt-get install libatlas-base-dev
sudo pip3 install cairocffi
sudo pip3 install wordcloud --upgrade

numpy.__version__升到了1.14,代码也能运行了。

我得到的词云图如下:

还好,基建狂魔家并不是只有房地产。

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Ki1381

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值