数据可视化-《白蛇2:青蛇劫起》(3)

目录

7影评词云分析

下载

​编辑 停用词处理:

 从PIL中导入Image的图片

词云运行结果图: 


喝瓶旺仔咱们继续 ......


 7影评词云分析

下载

pip install jieba  (如果一次下载没成功,就多下几次,不行了就上网查)

pip install jieba  

collections 统计词量

import jieba
import wordcloud
import collections

lcurt以列表形式对字符串进行切割

jieba.lcut(df['评论'][0])

运行结果图如下: 

我这边是有一个停用词文件(stopwords.txt),大家也可以在网上查找一下资源。

将停用词放在stop_words中,并且将停用词中的\n切掉。

代码展示如下:

with open('stopwords.txt','r',encoding='utf-8')as fp:
    words=fp.readlines()
    
stop_words = []
for word in words:
    w = word.strip('\n')#将单词中的反斜杠n切掉
    stop_words.append(w)
stop_words

运行结果图: 


 停用词处理:

 接下来我们开始对停用词进行处理,word_list = jieba.lcut(comment)。

然后对word_list做遍历,去掉停用词(可去网上找停用词资源)

#停用词处理
good_words =[]

for comment in df['评论']:
    word_list = jieba.lcut(comment)
    
    #对word_list做遍历,去掉停用词(去网上找停用词资源)
    for word in word_list:
        if word not in stop_words:
            good_words.append(word)
        

在下面这个代码中我们进行字体类型(蒙纳超刚黑简.ttf)的应用,并向词云对象配置词数数据,最终展示图片。代码如下: 

c = collections.Counter(good_words)

wc = wordcloud.WordCloud(font_path='蒙纳超刚黑简.ttf',width=500,height=300,
                        background_color='white',
                        max_font_size=200,
                        min_font_size=5,
                        max_words=1000)
#向词云对象配置词数数据
wc.generate_from_frequencies(c)

#展示图像
plt.imshow(wc)

运行结果如下:这个时候的词云大小颜色啥的都是由系统默认给出 ,如图所示:

 

 从PIL中导入Image的图片

from PIL import Image

 在上一个词云代码的基础上,我们给它添加了一个爱心的背景图片,并且给词云定义一种颜色由深到浅的,然后顺便将图旁边的横纵坐标关掉。代码如下:

back_image = Image.open(r'C:\Users\1\Desktop\1.png')

c = collections.Counter(good_words)

#调画布
plt.figure(figsize=(12,7))

wc = wordcloud.WordCloud(font_path='蒙纳超刚黑简.ttf',width=500,height=300,
                        background_color='white',
                         #背景颜色为白色
                        max_font_size=200,
                        min_font_size=5,
                          #调节词的大小为5-200
                        max_words=1000,
                         #最多能容纳词的数量为1000
                        mask=np.array(back_image),   
                         #放图片
                        colormap=sns.dark_palette('pink',as_cmap=True)  
                         #调词云颜色为一种颜色由深到浅的紫色,记得设置as_cmap=True这个参数,否则代码无法识别这个作为颜色参数处理
                        )
#向词云对象配置词数数据
wc.generate_from_frequencies(c)

#展示图像
plt.imshow(wc)
#把图旁边的横纵轴关掉
plt.axis('off')

词云运行结果图: 


至此数据可视化-《白蛇2:青蛇劫起》就此分析结束。觉得有用的友友们给我小小的点个赞吧,比心。

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

五彩大铁猿

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值