文本识别的起始应用与展示——词云

from wordcloud import WordCloud 	 #词云本云
import matplotlib.pyplot as plt   #作图利器
import jieba
import pandas as pd
import matplotlib.image as mpimg
import numpy as np 
from PIL import Image

text= pd.read_excel('C:/Users/zhangpeng/Desktop/词云.xlsx',header=0)

cnt=''
for rows in text[1]:
    cnt=cnt+rows 

cnt.replace(' ','')

wordlist = jieba.cut(cnt,cut_all=False)

wl='/'.join(wordlist)

imreceive=np.array(Image.open('C:/Users/zhangpeng/Desktop/词云.png'))

wc = WordCloud(
    background_color="white",    #背景颜色
       
    max_words=3000,       # 设置最大显示的词云数
         
    font_path='C:\Windows\Fonts\STHUPO.TTF',     # 这种字体都在电脑字体中,一般路径
    #     height= 1200,
    #     width= 1600,
       
    max_font_size=200,      # 设置字体最大值
    
    random_state=40,      # 设置有多少种随机生成状态,即有多少种配色方案
    mask=imreceive  #设置了mask 高和宽就没作用了
    )
 
myword = wc.generate(wl)  # 生成词云
   
plt.imshow(myword)     # 展示词云图
plt.axis("off")
plt.show()
wc.to_file('C:/Users/zhangpeng/Desktop/py_book.png') 

在这里插入图片描述
任何问题可在评论区沟通~

评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值