想通过python展示一些词出现频率,通过词大小显示出现次数,因此以下为主要搭建环境过程
1.安装wordcloud直接通pip install wordcloud会报VC++错误
结局方法
1.网上建议安装Twisted-17.9.0-cp36-cp36m-win_amd64.whl 下载并安装依然报错
2.自己下载wordcloud-1.3.2-cp36-cp36m-win_amd64.whl进行安装成功
2.简单测试
TypeError: cannot use a string pattern on a bytes-like object(类型转化错误)
import matplotlib.pyplot as plt
import pickle
from wordcloud import WordCloud,STOPWORDS,ImageColorGenerator
import jieba
import pandas as pd
data = pd.read_excel('sku_desc.xlsx') #读数据
df=data[data['dim_cat1_name']=='xx']
def cutword(x):
seg = jieba.cut(x) #结巴分词函数
return ' '.join(seg)#
df['seg_word']=df.title_desc.apply(cutword)
#背景
backgroud_Image = plt.imread('text.png')
#设置中文
font = r'C:\Windows\Fonts\simfang.ttf'
my_wordcloud = WordCloud(font_path=font).generate(str(df['seg_word'].values))
plt.imshow(my_wordcloud)
#是否显示x轴、y轴下标
plt.axis("off")
plt.show()