Python-制作可视化词云

本文介绍了如何使用Python制作可视化词云,从理解词云概念到实现步骤,包括数据读取、去停用词、统计词频,最后展示词云结果,并探讨了自定义背景图的方法。
摘要由CSDN通过智能技术生成

目录

一.对于可视化词云的理解

  • 对人、物、事的文本描述中,大量出现的词可以用于这些对象的标签,将这些标签按照词频的大小以图片的方式展示出来,就成为了可视化的个性化词云。
  • 例如,我们对某一类新闻进行词频统计,频繁出现的词语就是该类新闻的主题,将这些词语按大小进行图片填充,既形象也美观。
  • 工业化中使用较多,用于研究好像有点造作。

二.python的代码实现

(1)实现步骤

  • 收集预料:
    语料可以是某一类新闻,某一篇小说,某一篇报道,人物描述,公司描述,物品描述等等,通过某个语料,获取该语料的主题。
  • 2.数据读取:
    对于爬虫得到的数据需要去掉空行,对不规范的内容进行处理,对于规范的文本可以直接分词。
  • 3.去停止词
    分词后需要去掉停止词,停止词的词频很大,影响结果。
  • 4.统计词频
  • 5.使用wordcloud制作成词云

(2)代码说明

1.导入需要的库
import warnings
warnings.filterwarnings('ignore')
import jieba
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import matplotlib
from wordcloud import WordCloud
2.读取数据
#数据来自蚂蚁花呗客服对话
df=pd.read_csv('./valid.csv', sep='\t', header=None,names=['segment'])
#针对爬虫得到的不规范数据需要进行精细处理
df=df.dropna()
content=df.segment.values.tolist()
segment=[]
for line <
  • 2
    点赞
  • 31
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值