python生成的词云在哪里_利用python生成词云

利用python的wordcloud包生成词云,分析前程无忧数据分析岗位的岗位职责和岗位要求

import pandas as pd

import jieba,re

from scipy.misc import imread

from wordcloud import WordCloud, ImageColorGenerator,STOPWORDS

import matplotlib.pyplot as plt

data=pd.read_excel('51jobanaly1.xlsx')#读取Excel转为dabaframe

df=pd.DataFrame(data)

nrows=df.shape[0]#获得一共有多少行

file1=df.岗位职责.dropna(how='any')#去掉空值

file2=df.岗位要求.dropna(how='any')

text1=''.join(i for i in file1)#把所有字符串连接成一个长文本

text2=''.join(i for i in file2)

responsibility=re.sub(re.compile(',|;|\.|、|。'),'',text1)#去掉逗号等符号

requirement=re.sub(re.compile(',|;|\.|、|。'),'',text2)

wordlist1=" ".join(jieba.cut(responsibility,cut_all=True))#分析岗位职责

#wordlist1=" ".join(jieba.cut(requirement,cut_all=True))#分析岗位要求

font_path=r'C:\Windows\Fonts\simkai.ttf'

stopwords = list(STOPWORDS)+['数据','分析','负责','相关','公司','进行','工作']#分析岗位职责

#stopwords = list(STOPWORDS)+['以上学历','优先','计算','经验','学历','上学','熟练','使用','以上']#分析岗位要求

bgimg=imread(r'C:\Users\lbship\Desktop\mice.jpg')#设置背景图片

wc = WordCloud(font_path=font_path, # 设置字体

background_color="white", # 背景颜色

max_words=2000, # 词云显示的最大词数

stopwords = stopwords, # 设置停用词

mask=bgimg, # 设置背景图片

max_font_size=100, # 字体最大值

random_state=42,#设置有多少种随机生成状态,即有多少种配色

width=1000, height=860, margin=2,# 设置图片默认的大小,margin为词语边缘距离

).generate(wordlist1)

image_colors = ImageColorGenerator(bgimg)#根据图片生成词云颜色

plt.imshow(wc)

plt.axis("off")

plt.savefig("examples.jpg")#必须在plt.show之前,不是图片空白

plt.show()

效果

image.png

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值