向词云开战!(一)

  • 环境配置:我的是pycharm+ANACONDA3_4.3.1。之前没有安装需要的jieba和WordCloud,但是这很简单,直接从官网找到两个包下zip版本之后解压到ANACONDA3_4.3.1下的pkgs,点开pycharm设置->project interxxxx 然后点击+号,搜索jieba和wordcloud点击下方的install即可
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述

  • 准备文字包:wordcloud自己是不支持中文的,需要自己安装相应的中文包,直接搜索C:/Windows/Fonts,然后从中复制一个中文字体,然后复制到ANACONDA3_4.3.1安装路径下的 \Lib\site-packages\PIL文件夹中,最好起一个比较段的英文名字,不然可能会出现下面的错误。

  • 准备txt文本:这里用了周董的一些经典歌词而我已经分不清 你是友情 还是错过的爱情。你说不该再相见只为了瞬间 谢谢你让我听见 因为我在等待永远。如果我冲出黑幕笼罩的天空 就别(想)在捆绑我的自由。岁月在墙上剥落看见小时候。如果说分手是苦痛的起点,那在终点之前我愿意再爱一遍。不懂你的黑色幽默,想通却又再考倒我,说散你想很久了吧?爱像一阵风,吹完它就走,这样的节奏,谁都无可奈何。城市霓虹 不安跳动染红夜空 过去种种 像一场梦 不敢去碰 一想就痛。思念像底格里斯河般的漫延,当古文明只剩下难解的语言,传说就成了永垂不朽的诗篇。爱能不能够永远单纯没有悲哀。我真的没有天份,安静的没这么快,我会学着放弃你,是因为我太爱你。该不该搁下重重的壳,寻找到底哪里有蓝天,随着轻轻的风轻轻的飘,历经的伤都不感觉疼,我要一步一步往上爬,等待阳光静静看着它的脸,小小的天有大大的梦想,重重的壳挂着轻轻的仰望。趁时间没发觉,让我带着你开,这不是顽强,这不是逃避,没人绑着你走才快乐。谁在用琵琶弹奏一曲东风破,枫叶将故事染色结局我看透,篱笆外的古道我牵着你走过,荒烟漫草的年头就连分手都很沉默。不要你离开 距离隔不开 思念变成海 在窗外进不来。情绪莫名的拉扯 我还爱你呢 而你断断续续唱着歌 假作没事了。人雁南飞 转身一瞥你噙泪 掬一把月 手揽回忆怎么睡。为自己的人生鲜艳上色 先把爱涂上喜欢的颜色 笑一个吧 功成名就不是目的 让自己快乐快乐这才叫做意义 童年的纸飞机 现在终於飞回我手里 。听妈妈的话别让她受伤,想快快长大才能保护她,美丽的白发幸福总发芽,天使的魔法温暖中慈祥。为什么上课时举手很难为什么拿线上宝物简单……这第一名到底有多强到底还要过多少关 。翻着我们的照片,想念若隐若现,去年的冬天,我们笑得很甜。保存成txt就可以了。

  • 关于代码:这个是根据这篇博文改的,很好懂,也都有注释。要改的地方只有两个,一个是text = open(r’T:\学习\cloudword\words.txt’, “r”).read()中的’T:\学习\cloudword\words.txt’,这里需要改成自己txt文本所在的路径,还有一个就是wc = WordCloud(font_path=r"E:\ANACONDA3_4.3.1\Lib\site-packages\PIL\A.ttf", background_color=‘white’, width=800,height=600, max_font_size=50,max_words=1000)中的font_path=r"E:\ANACONDA3_4.3.1\Lib\site-packages\PIL\A.ttf"这个要改成你的文字包所在的路径。

import matplotlib.pyplot as plt  # 数学绘图库
import jieba  # 分词库
from wordcloud import WordCloud  # 词云库

# 1、读入txt文本数据
text = open(r'T:\学习\cloudword\words.txt', "r").read()

# 2、结巴分词,默认精确模式。可以添加自定义词典userdict.txt,然后jieba.load_userdict(file_name) ,file_name为文件类对象或自定义词典的路径
# 自定义词典格式和默认词库dict.txt一样,一个词占一行:每一行分三部分:词语、词频(可省略)、词性(可省略),用空格隔开,顺序不可颠倒

cut_text = jieba.cut(text)
result = "/".join(cut_text)  # 必须给个符号分隔开分词结果来形成字符串,否则不能绘制词云
# print(result)

# 3、生成词云图,这里需要注意的是WordCloud默认不支持中文,所以这里需已下载好的中文字库
# 无自定义背景图:需要指定生成词云图的像素大小,默认背景颜色为黑色,统一文字颜色:mode='RGBA'和colormap='pink'
wc = WordCloud(font_path=r"E:\ANACONDA3_4.3.1\Lib\site-packages\PIL\A.ttf", background_color='white', width=800,
               height=600, max_font_size=50,
               max_words=1000)  # ,min_font_size=10)#,mode='RGBA',colormap='pink')
wc.generate(result)
wc.to_file(r"T:\wordcloud.png")
# 按照设置的像素宽高度保存绘制好的词云图,比下面程序显示更清晰

# 4、显示图片
plt.figure("词云图")  # 指定所绘图名称
plt.imshow(wc)  # 以图片的形式显示词云
plt.axis("off")  # 关闭图像坐标系
plt.show()


  • 关于OSError:cannot open resource File “xxxx\ImageFont.py”出现这个错误的原因可能是你给的文字包路径有问题,最好按照我上一步说的将路径放在\Lib\site-packages\PIL下面并且改一个短小的英文名。
  • 完事具备,只差运行在这里插入图片描述
  • 生成成功,还有很多定制功能值得去探索一下,之后会不定期持更~可能会爬一些有趣的东西哈哈哈哈
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值