python绘制词云_Python 绘制词云

最新推荐文章于 2024-01-30 08:30:00 发布

weixin_39639040

最新推荐文章于 2024-01-30 08:30:00 发布

阅读量191

点赞数

文章标签： python绘制词云

文本内容：data（包含很多条文本）

1、分词：

import jieba

data_cut = data.apply(jieba.lcut)

2、去除停用词：

with open(r'D:\数据文件\stoplist.txt', encoding='utf-8') as f:

txt = f.read()

stop = txt.split()

stop = stop + [' '] #把空格加进去

data_after = data_cut.apply(

lambda x : [i for i in x if i not in stop]

)

3、

from tkinter import _flatten

tmp = pd.Series(_flatten(list(data_after))) #把二维变成一维

num = tmp.value_counts()

4、绘制

from wordcloud import WordCloud

import matplotlib.pyplot as plt

pic = plt.imread(r'D:\数据文件\aixin.jpg')

wc = WordCloud(

background_color='white',

mask=pic,

font_path=r'C:/Windows/Fonts/simsun.ttc')

wc2 = wc.fit_words(num)

plt.imshow(wc2)

plt.axis('off')

plt.show()

标签：plt,Python,data,pic,stop,词云,import,txt,绘制

来源： https://www.cnblogs.com/DDiamondd/p/11183079.html

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

weixin_39639040

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

python3制作中文词云_python3根据词频绘制词云

weixin_32009069的博客

01-12

1960

操作系统win10 64位准备环境pip3 install re - 正则表达式库pip3 install collections - 词频统计库pip3 install numpy - numpy数据处理库pip3 install jieba - 结巴分词pip3 install wordcloud - 词云展示库pip3 install PIL - ...

使用Python绘制词云图片

Alex_7_7的博客

01-27

6645

使用Python绘制词云图片过程如下：在官网下载一个Python的安装包。首先，查看自己电脑是32位还是64位。针对不同的电脑选择不同的版本。 64位地址为：https://www.python.org/ftp/python/3.9.0/python-3.9.0-amd64.exe 32位地址位：https://www.python.org/ftp/python/3.9.0/python-3.9.0.exe 下载完成后，按照提示进行安装。路径选择在D盘中。路径为D:\Python python 安装完成后

参与评论您还未登录，请先登录后发表或查看评论

Python3下使用WC和numpy做云图

Mike_Shine的博客

09-27

598

分为两个部分来完成： 1. 得到分词。 2. 数据处理 3. 生成云图。 1. 分词的获取。这里的分词可以是来源于爬取的文本，之后用 jieba 包做一下分词（用jieba.cut()方法）。会得到分词集合（这里返回的是generator）。可以写一个小函数来对分词结果进行初步处理。如下，可以避免单个字或者换行符号。 2. 数据处理上面得到了最原始的文本分词。这里需要将...

python文本数据挖掘_python数据挖掘第三篇-垃圾短信文本分类

weixin_39855869的博客

11-21

548

数据挖掘第三篇-文本分类文本分类总体上包括8个步骤。数据探索分析-》数据抽取-》文本预处理-》分词-》去除停用词-》文本向量化表示-》分类器-》模型评估.重要python库包括numpy(数组),pandas(用于处理结构化数据),matplotlib（绘制词云，便于直观表示）,sklearn(提供大量分类聚类算法库).1.数据探索分析（1）获取大量未经过处理的文档，且标记好文档所属类型。（2）给...

基于Python的微信聊天记录分析——可视化方法与主题模型构建

最新发布

Henryli1202的博客

01-30

6612

本篇为《基于Python的微信聊天记录分析》系列的第三篇，主要讲解在Python环境下对聊天记录进行进一步的可视化，并对聊天内容进行初步挖掘。第一章主要利用wordcloud构建词云，并基于matplotlib生成聊天热力图；第二章主要利用gensim构建LDA主题模型聚类生成聊天记录主题，并利用pyLDAvis生成可视化结果。希望和大家多多交流，共同进步！

python爬取新闻数据

qq_57344778的博客

03-22

5686

爬虫数据网址：新闻中心滚动新闻_新浪网最近想获取一些新闻数据来做一个NLP的分类模型所以爬取了新浪的一些新闻数据用于学习使用。首先先查看网页源码：发现url中id和类别中的s_id相等，经过尝试替换，发现该编号确实是类别所在标签。有发现page这个参数和页数相同，其中num=50,和pageid=153这两个参数没有太大的影响，所以就可以通过修改这两个参数的值来获得不同标签下的url了。然后通过这个url 放入谷歌浏览器中去抓取数据所在的json：可以发现每个数据文件..

【毕业设计】酒店评价情感倾向分析系统 - python 深度学习

caxiou的博客

11-16

1348

🔥 Hi，大家好，这里是丹成学长的毕设系列文章！🔥 对毕设有任何疑问都可以问学长哦!这两年开始，各个学校对毕设的要求越来越高，难度也越来越大… 毕业设计耗费时间，耗费精力，甚至有些题目即使是专业的老师或者硕士生也需要很长时间，所以一旦发现问题，一定要提前准备，避免到后面措手不及，草草了事。为了大家能够顺利以及最少的精力通过毕设，学长分享优质毕业设计项目，今天要分享的新项目是🚩基于深度学习的酒店评价的情感倾向分析🥇学长这里给一个题目综合评分(每项满分5分)难度系数：4分工作量：4分。

统计论文_python词云_爬取论文_pleasantckb_

09-29

在该项目中，我们将抓取到的论文标题进行预处理，如去除停用词、标点符号和数字，然后计算每个词的频率，最后使用wordcloud库绘制出词云，展示高频词汇，从而洞察网站的论文热点。接下来，关于“pleasantckb”，这...

word_python词云_

10-03

`wordcloud`库在生成词云时需要将结果绘制到图像上，这就需要用到`PIL`。如果你还没有安装`PIL`，可以通过以下命令安装： ```bash pip install pillow ``` 现在，让我们来看一下如何使用这两个库来生成词云。首先...

Python 绘制词云图：更改或自定义背景颜色，图片轮廓，图片大小等，根据词频生成(放入自写库，一行代码快速实现复杂绘图)

12-22

词云的作用已不必多说，也有许多不同版本生成词云的方法，但有时候调整图片细节能把人给调得脚趾头不自觉的瞉起。所以为何不直接将其封装进一个函数中，将各种绘制参数都事先准备好，尽可能一了百了呢？说干就干，看...

去除停用词并绘制词云图

taoyuanyuan_的博客

04-23

3896

简单处理数据后绘制词云图以前看见词云图完全没想过它是怎么做出来的，现在才知道Python是可以画词云图的，而且非常简单，只要数据处理好。 # -*- coding: gb2312 -*- #coding=gbk import pandas as pd import numpy as np import jieba from tkinter import _flatten import matpl...

python词频可视化词云_数据爬虫、词频统计可视化、词云绘制、语句情感审查——飞桨PaddleHub实战...

weixin_39583013的博客

12-05

1320

爱奇艺《青春有你2》评论数据爬取,并对评论中的词频进行统计以及对评论进行健康情感审查随着《青春有你2》的热播，你有没有被那些漂亮的小姐姐吸引呢？作为一个发际线已经到后脑勺的程序员，小姐姐的舞姿、歌声那些都是浮云。你想不想知道每期节目，观众评论最多的内容是什么？评论的内容是否健康呢？通过这篇博客，我将手把手教你如何实现。需要的配置和准备工作1、中文分词需要jieba2、词云绘制需要wordcloud...

Python-数据处理之一

wxl_1605的博客

07-16

635

import pandas as pd import numpy as np data = pd.read_excel('data.xls') data #表的列属性 data.columns #表的大小 data.shape #对于某一列属性，是字典嵌套字典类型的，想取其中，某一个key的value，用apply： data['better_price0'] = data['price'].ap...

python中apply函数的使用

qq_44788797的博客

05-08

3735

数据挖掘使用apply函数对数据的处理（python）前段时间在搞一个数据挖掘之类的比赛，发现对数据进行预处理时，大家使用比较多的是apply函数，apply函数是pandas库中的函数，非常好用的一个函数相当于循环遍历，起到对每一条数据进行处理的效果。说到apply又不得不说lambda函数了，这两个结合来用简直爽的不行。 lambda关键字可以用来创建一个小的匿名函数示例：DataFrame.apply(func, axis=0, broadcast=False, raw=False, reduc

评分卡建模流程

qingliangdexiar的专栏

11-03

375

核心代码讲解：注解：核心代码也是参考之前人的代码，理解的；希望读者引用时候，也附上本作者地址 def split_cut_result(data, get_col_continuous_cut_points): cols = [i for i in data.columns if i not in [i[0] for i in get_col_continuous_cut_points]] data_cut_result = data[cols].copy() for c...

Python 绘制词云

weixin_30318645的博客

07-14

168

文本内容：data（包含很多条文本） 1、分词： import jieba data_cut = data.apply(jieba.lcut) 2、去除停用词： stoplist.txt：链接：https://pan.baidu.com/s/1lN1J8aUFOwqXpYMzuqVA7w提取码：nk7z with open(r'D:\数据文件\stoplis...

对文件中语句使用jieba分词后再进行词典编码

qq_63840285的博客

01-27

264

这是一个简单对表格进行预处理的一串代码

Python中的lambda和apply用法