利用jieba进行分词，词云图展示

最新推荐文章于 2024-06-08 15:52:21 发布

pyswt

最新推荐文章于 2024-06-08 15:52:21 发布

阅读量4.3k

点赞数 3

分类专栏： jieba分词文章标签： jieba 数据分析 python

本文链接：https://blog.csdn.net/python3_i_know/article/details/85011515

版权

博客介绍了使用jieba进行中文分词时遇到的字体错误问题，详细解析了错误原因——系统缺少特定字体。解决方法是找到字体的英文名称，并将其作为参数设置在词云图的font_path中。

摘要由CSDN通过智能技术生成

import jieba
from scipy.misc import imread
from wordcloud import WordCloud,STOPWORDS,ImageColorGenerator
import matplotlib.pyplot as plt
import pandas as pd

def get_word():
    df = pd.read_csv('weixiaobao_data/wen.txt', sep='\t')
    word_list = df['MsgTitle'].tolist()
    return word_list


def get_word_list(mylist):
    word_list = [' '.join(jieba.cut(sen)) for sen in mylist]
    new_text = ' '.join(word_list)
    pic_path = 'buity.jpg'
    im_mask = imread(pic_path)

    wordcloud = WordCloud(background_color='white',
                          font_path=r'C:\Windows\Fonts\simfang.ttf',
                          mask=im_mask,
                          stopwords=STOPWORDS).generate(new_text)

    plt.imshow(wordcloud)
    plt.axis('off')
    plt.show()
    wordcloud.to_file('ciyun.jpg')


word_list = get_word()
get_word_list(word_list)

最低0.47元/天解锁文章

pyswt

关注

3
点赞
踩
15

收藏

觉得还不错? 一键收藏
0
评论
利用jieba进行分词，词云图展示

import jiebafrom scipy.misc import imreadfrom wordcloud import WordCloud,STOPWORDS,ImageColorGeneratorimport matplotlib.pyplot as pltimport pandas as pddef get_word(): df = pd.read_csv('weix...
复制链接

扫一扫

专栏目录