统计csv词频_Jieba统计词频并生成csv文件

本文介绍如何利用Python的Tkinter创建UI读取数据,通过jieba进行中文分词,并将统计结果保存为CSV文件。jieba支持精确、全和搜索引擎三种分词模式,以及关键词抽取算法。文章提供了从清洗数据、分词到词频统计的完整代码示例。
摘要由CSDN通过智能技术生成

一、制作简单UI读入数据

包括文本框、导入按钮、开始按钮的

import tkinter as tk # 使用Tkinter前需要先导入

window = tk.Tk()

window.title('My Window')

window.geometry('600x300') # 这里的乘是小x

t = tk.Text(window,width=80,height=15)

t.place(x=10, y=10)

def import_file(): # 在鼠标焦点处插入输入内容

pass

def run(): # 在文本框内容最后接着插入输入内容

print(t.get('0.0','end'))

t.delete('0.0','end')

# tk.messagebox.showinfo(title='', message='')

b1 = tk.Button(window, text='导入', width=10,height=2, command=import_file).place(x=300, y=220)

b2 = tk.Button(window, text='运行', width=10,height=2, command=run).place(x=400, y=220)

window.mainloop()

二、分词功能实现

使用jieba对输入

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值