python 统计词频后输出结果到Excel和txt文档

本文介绍如何利用Python的jieba库进行文本分词,并统计词频。内容涉及读取文件、处理文本、将结果输出到txt和Excel,以及生成词云图,适合文本分析和热点词统计场景。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

分词的应用场景还是蛮多的,比如电商里面的产品用户评价,每个商品的评价数很多,由于是大量的文本,需要从这些文本找出评价的关键字,这个时候分词就能派上用场;再比如,做文本分析,热点词统计都会用到分词。

整体思路就是利用python中的jieba库,对每一行文字进行分词处理,处理之后的结果放在list(列表)中。遍历列表,重复的值就计数,留下唯一的值作为key。

引用库

import jieba                      #分词
import xlwt                       #Excel库
import pandas as pd               #pandas库
import matplotlib as mpl          #matplotlib库由各种可视化类构成
from wordcloud import WordCloud   #词云
import matplotlib.pyplot as plt  #matplotlib.pyplot是绘制各类可视化图形的命令字库,相当于快捷方式

配置

mpl.rcParams["font.sans-serif"] = ['Microsoft YaHei']#配置字体
plt.rcParams["axes.labelsize"] = 16   #轴域大小
plt.rcParams["xtick.labelsize"] =14   #x轴字体大小
plt.rcParams["ytick.labelsize"] =14   #y轴字体大小
plt.rcParams["legend.fontsize"]=12    #图例字体大小
plt.rcPara
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值