利用jieba进行分词,词云图展示

博客介绍了使用jieba进行中文分词时遇到的字体错误问题,详细解析了错误原因——系统缺少特定字体。解决方法是找到字体的英文名称,并将其作为参数设置在词云图的font_path中。
摘要由CSDN通过智能技术生成
import jieba
from scipy.misc import imread
from wordcloud import WordCloud,STOPWORDS,ImageColorGenerator
import matplotlib.pyplot as plt
import pandas as pd

def get_word():
    df = pd.read_csv('weixiaobao_data/wen.txt', sep='\t')
    word_list = df['MsgTitle'].tolist()
    return word_list


def get_word_list(mylist):
    word_list = [' '.join(jieba.cut(sen)) for sen in mylist]
    new_text = ' '.join(word_list)
    pic_path = 'buity.jpg'
    im_mask = imread(pic_path)

    wordcloud = WordCloud(background_color='white',
                          font_path=r'C:\Windows\Fonts\simfang.ttf',
                          mask=im_mask,
                          stopwords=STOPWORDS).generate(new_text)

    plt.imshow(wordcloud)
    plt.axis('off')
    plt.show()
    wordcloud.to_file('ciyun.jpg')


word_list = get_word()
get_word_list(word_list)
  • 3
    点赞
  • 15
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值