python 对excel文件进行分词并进行词频统计_使用wordcloud生成李子柒词云-趣玩Python系列五

本文介绍了如何使用Python对Excel文件进行分词和词频统计,并通过Wordcloud生成李子柒主题的词云。内容包括预处理文本、jieba分词、自定义词汇和排除无用词等步骤。
摘要由CSDN通过智能技术生成

最近在做一个的统计小工具,用到了词云和词频统计功能。 其实之前在做采集的项目时,这二个模块已经用得比较多了,在我看来,还是能归到趣玩Python系列当中的,希望对没有使用过的朋友有所帮助,直接进入正文吧!

最近李子柒更新了一个蓝印花布的视频,在微博爆火,当然,那是视频,在文章中没办法去抓里面的字幕,其实也可以实现(opencv进行处理),本文中就不再进行细说,如果有可能,下一个趣玩系列更新时我会写入到其中。

17bed113-c611-442a-acc2-1a6bcfe4e09f

这次需要分析的文本我已经下载并保存好,起名为article.txt文件。另外我还准备了一个名为base_show.jpeg的背景文件,一会在使用的过程中我会进行使用说明。

1、先安装必要模块:

import reimport collectionsimport jiebafrom wordcloud import WordCloudimport matplotlib.pyplot as pltfrom PIL import Imageimport numpy as np

2、新建main.py 文件 ,

  • 1
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值