wordcloud 用法及名著词云统计

python 第三方库 wordcloud 基本用法

wordcloud是一个词云展示的第三方库 ,需要安装使用。
以下演示在windows环境下进行。
演示版本为python3.7.4

1.安装
安装前在 pycharm中导入显示有问题
在这里插入图片描述
在windows联网下cmd窗口使用pip命令直接安装
pip install wordcloud

C:\WINDOWS\system32>pip install wordcloud
Collecting wordcloud
  Downloading https://files.pythonhosted.org/packages/23/4e/1254d26ce5d36facdcbb5820e7e434328aed68e99938c75c9d4e2fee5efb/wordcloud-1.5.0-cp37-cp37m-win_amd64.whl (153kB)
    100% |████████████████████████████████| 163kB 661kB/s
Collecting numpy>=1.6.1 (from wordcloud)
  Downloading https://files.pythonhosted.org/packages/ce/61/be72eee50f042db3acf0b1fb86650ad36d6c0d9be9fc29f8505d3b9d6baa/numpy-1.16.4-cp37-cp37m-win_amd64.whl (11.9MB)
    100% |████████████████████████████████| 11.9MB 340kB/s
Collecting pillow (from wordcloud)
  Downloading https://files.pythonhosted.org/packages/40/f2/a424d4d5dd6aa8c26636969decbb3da1c01286d344e71429b1d648bccb64/Pillow-6.0.0-cp37-cp37m-win_amd64.whl (2.0MB)
    100% |████████████████████████████████| 2.0MB 439kB/s
Installing collected packages: numpy, pillow, wordcloud
Successfully installed numpy-1.16.4 pillow-6.0.0 wordcloud-1.5.0
You are using pip version 19.0.3, however version 19.1.1 is available.
You should consider upgrading via the 'python -m pip install --upgrade pip' command.

自动对依赖的模块进行安装,安装后显示Successfully installed表示已经安装成功

再次查看pycharm中的import wordcloud没有红线,及表示可以正常使用
在这里插入图片描述
2.基本用法

import wordcloud

#wordcloud.WordCloud()    代表一个文本对应的词云,是词云对应的基础
w = wordcloud.WordCloud()#配置词云对象w
w.generate("python and wordcloud")   #向对象w中输入加载文本(默认以空格进行区分)
w.to_file("outfile.jpg")   #将词云生成为图像文件,命名为outfile.jpg

print(__file__)#查看当前文件路径

报错了
在这里插入图片描述
显示没有 matplotlib
在cmd中输入命令pip install matplotlib 即可
再次执行,会在当前脚本路径下生成对应的文件(默认为400*200像素)
在这里插入图片描述
3.对名著进行统计分析

import wordcloud
import jieba
import PIL.Image as image
import numpy
filename = 'E:/untitled/test/liyu.txt'
f = open(filename)
t = f.read()
f.close()
ls = jieba.lcut(t)#利于jieba库进行分词
txt = " ".join(ls)#将列表转换为空格分隔的字符串
mask = numpy.array(image.open("E:/untitled/test/peiqi.png"))#导入词云形状为小猪佩奇
w = wordcloud.WordCloud(font_path="msyh.ttc",  #设置字体为微软雅黑
                        width=1000,  #设置图片长度为1000
                        height=800,  #设置图片宽度为800
                        min_font_size=4,  # 最小字体为4号
                        max_font_size=100,# 最大字体为50号
                        max_words= 80,#设置词云单词数量
                        mask = mask,#改变词云形状
                        background_color="white"# 设置背景颜色为白色
                        )
w.generate(txt)
w.to_file("liyu.jpg")#默认和当前程序在同一目录


结果如下:
在这里插入图片描述

jieba 库主要是对中文进行以空格分词,最常用的为lcut方法
numpy,PIL是第三方库,我忘记了电脑什么时候安装的,这里就不再重新安装了,你们使用pip联网自己安装即可。

感谢“中国大学”提供思路
感谢宁老师带入门

  • 4
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
### 回答1: 可以使用Python中的词云库(如wordcloud)和文本处理库(如jieba)来制作四大名著主要人物词云。 具体步骤如下: 1. 读取四大名著的文本文件(如红楼梦、西游记、水浒传、三国演义)。 2. 使用文本处理库(如jieba)对文本进行分词处理,得到每个词语。 3. 根据需要,可以去除一些无意义的词语(如“的”、“了”、“是”等),或者添加一些关键词(如主要人物的名字)。 4. 统计每个词语出现的次数,生成词频表。 5. 使用词云库(如wordcloud)根据词频表生成词云图。 6. 根据需要,可以调整词云图的颜色、形状、字体等参数。 7. 最后保存词云图到本地或者展示在网页上。 以上是制作四大名著主要人物词云的基本步骤,具体实现可以参考相关的Python代码和教程。 ### 回答2: Python是一种高级编程语言,可以用来制作各种数据可视化工具,包括词云。为了制作四大名著主要人物的词云,我们需要掌握以下几个步骤: 第一步,准备文本数据。我们需要从四大名著中抽取主要人物的名字来制作词云。可以使用Python中的自然语言处理工具,比如NLTK或jieba,来完成这个任务。 第二步,处理文本数据。需要对文本数据进行清洗、分词、去除停用词等预处理工作。这可以使用Python中的字符串处理和NLTK或jieba中的分词工具来完成。 第三步,制作词云。Python中有很多词云制作的库,比如WordCloud和pytagcloud。可以使用它们来生成美观的词云。 具体实现时,我们可以按照以下步骤来制作四大名著主要人物词云: 1. 从四大名著中抽取主要人物的名字,可以使用正则表达式或NLTK中的命名实体识别工具来完成。 2. 对文本数据进行清洗和分词处理,可以使用Python字符串处理函数和jieba库来完成。 3. 去除停用词和低频词,可以使用NLTK提供的停用词表和TF-IDF算法来完成。 4. 使用WordCloud或pytagcloud库生成词云图像,并调整颜色、字体、布局等参数使其更加美观。 最终,我们可以得到一张四大名著主要人物词云,展示出每个主要人物的重要性和影响力。这样的可视化工具可以被应用在教育、文化和社会研究等领域,为读者和研究者提供更加深入的洞察力和认识。 ### 回答3: 四大名著主要人物词云,顾名思义就是将四大名著中的主要人物进行提取关键词并制作成词云的一个过程。其中四大名著指的是《红楼梦》、《西游记》、《水浒传》、《三国演义》,这些作品中都有着众多千古名人,他们的形象深深地刻在了许多读者的脑海中。而我们通过词云的方式,可以将这些人物的特点和形象更加直观地呈现出来。 首先,我们需要将四大名著的文本进行处理,通过分词、去停用词等方式对文本进行清洗。接着,利用Python中的jieba分词工具,将文本转化为词语列表。然后,我们可以设置每个人物的特定关键词,如贾宝玉的关键词可以是“荒唐、富贵、痴情”,而悟空的关键词可以是“聪明、顽皮、逍遥自在”。在这个过程中,可以根据人物的特点和形象来设定关键词,尽可能地凸显他们的个性和特点。 接下来,我们可以使用Python中的wordcloud库,将创建好的词语列表制作成词云。这里需要用到词云制作的基本原理,即根据词语出现的频率和重要性,将其放置到不同的位置和大小,形成美观的词云。可以根据自己的设计需求,调整词云的字体、颜色、背景等等。 最后,经过数据分析和图像设计,我们可以得到一系列以四大名著主要人物为主题的词云图,呈现出每个人物的形象和特色,也反映了这些人物在古代文学中的地位和影响。 总之,通过Python的文本处理和词云制作,我们可以更加深入地了解和感受四大名著中的主要人物,如它们的思想、气质、习惯等等,为我们学习和研究古代文学提供了一个新的视角。
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值