词云图分析微博评论

微博评论词云图

最近小猪在5月20号发布了一篇对周扬青的小作文,我正好也想做一个词云图的项目,
所以爬取了这条微博的评论,做个词云图来看看大家都在说些什么,
PS:有些信息只能脱敏

#导包
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import repeat_word as rw
import jieba
import jieba.analyse
from wordcloud import WordCloud,STOPWORDS #词云图,屏蔽词
from PIL import Image#读取图片

#显示中文
plt.rcParams['font.sans-serif']='simhei'
plt.rcParams['axes.unicode_minus']=False

数据处理

# 这是我之前已经爬取好的评论数据
df =  pd.read_excel(r"F:\Eddy\罗志祥博文评论.xlsx")
df.head()
发帖子人 博文发布时间 评论者 评论内容 评论时间 评论点赞
0 lzx 5月20日 09:12 1 四十岁啦还自称男孩6666(学到了 5月20日 13:20 1163934.00
1 lzx 5月20日 09:12 2 土狗,我初中就不写这种东西了 5月20日 09:20 953578.00
2 lzx 5月20日 09:12 3 热搜预备:罗志祥舔起来了 5月20日 09:12 370486.00
3 lzx 5月20日 09:12 4 不是繁体,是本人写的吗?难每天半夜给周扬青发消息的只是你的替身?是个大陆人? 5月20日 09:17 324679.00
4 lzx 5月20日 09:12 5 你的恋爱,我心疼;你的文字,还爱她。 5月20日 09:18 261725.00
df.info()
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 687 entries, 0 to 686
Data columns (total 6 columns):
 #   Column  Non-Null Count  Dtype  
---  ------  --------------  -----  
 0   发帖子人    687 non-null    object 
 1   博文发布时间  687 non-null    object 
 2   评论者     686 non-null    object 
 3   评论内容    679 non-null    object 
 4   评论时间    686 non-null    object 
 5   评论点赞    349 non-null    float64
dtypes: float64(1), object(5)
memory usage: 32.3+ KB
#删除无评论项
df.dropna(inplace=True)
# 重置下索引
df<
  • 1
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

WiFi下的365

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值