【python特供版】子鼠年遇上《滕王阁序》的词云
0、本文的目标
就是利用python进行画图,把《滕王阁序》的词汇进行处理,提取高频重要词汇,再按照米老鼠的图像,把这些高频词汇放入米老鼠的图像中,生成新的图像
1、首先确定需要导入和安装的包
from os import path
from PIL import Image
import numpy as np
import matplotlib.pyplot as plt
import jieba
from wordcloud import WordCloud, STOPWORDS
1、包的安装
如果没有这些包,推荐使用命令行进行安装pip install jieba
;
2、包的简介
os是操作系统文件的包;PIL是处理图片的包;numpy是数学运算方面的包,这里主要用于文字数组的处理;matplotlib主要是用于画图的工具包;jieba主要用于对于词汇的处理,进行分词;wordcloud直译就是词云。
2、准备工作
1、先把《滕王阁序》的文章放入本地的一个txt文件之中
这里需要多说一句:字体文件如果是windows系统要确定,这个文件是gbk的格式哦!怎么看呢,就是打开文件,另存为的时候,选择是ANSI编码,否则程序会报错:
2、准备好图片
这里选中图片最好以png格式最好,这里我就偷个懒,选择了背景色为白色的米老鼠图片。大家注意的是要选择边界线比较清楚地图案!