WordCloud的使用方法

这段代码展示了如何利用jieba分词和WordCloud库对文本进行处理和可视化。首先,通过pickle加载章节内容,然后读取停用词列表,使用jieba进行文本分词并过滤掉停用词。接着,将处理后的字符串传递给WordCloud生成词云,并指定背景图片。最终,展示词云图,其中的词频反映了文本中各词汇的重要性。
摘要由CSDN通过智能技术生成

1.安装WordCloud

pip install wordcloud

2.导入

import pickle
import jieba
import pandas as pd
import wordcloud
import matplotlib.pyplot as plt
from imageio import imread
#%%
#读取chapter


pickle_file = open(r'C:\Users\yandi\PycharmProjects\MachineLearing\LearningTest01\SDTest\chapter.pkl','rb')
chapter = pickle.load(pickle_file)
pickle_file.close()

#%%
#读取停用词
stoplist = list(pd.read_csv(r'C:\Users\yandi\PycharmProjects\MachineLearing\LearningTest01\停用词.txt',
                            names=['w'],sep='aaa',encoding='UTF-8',engine='python').w)

def m_cut(intxt):
    return [w for w in jieba.cut(intxt) if w not in stoplist and len(w) > 1]

ls = " ".join(m_cut(chapter.txt[1]))
#%%
cloudobj = wordcloud.WordCloud(mask=imread(r'C:\Users\yandi\PycharmProjects\MachineLearing\LearningTest01\射雕背景0.jpg'),
                               mode='RGBA',background_color=None
                               ).generate(ls)
#%%
plt.imshow(cloudobj)
plt.axis('off')
plt.show()
  1. ls是字符串,但是传到WordCloud里面必须是用空格间隔的
  2. mask是指定背景图片
  3. 指定图片的色系
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值