python3.6-制作一个含有NLP基本功能系统（Windows exe）自然语言处理系统

最新推荐文章于 2023-12-08 02:24:24 发布

bensonrachel

最新推荐文章于 2023-12-08 02:24:24 发布

阅读量734

点赞数 2

分类专栏：《自然语言处理》相关 python 自然语言处理文章标签：自然语言处理 nlp 界面设计交互设计 python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/bensonrachel/article/details/108087340

版权

python 同时被 3 个专栏收录

17 篇文章 0 订阅

订阅专栏

《自然语言处理》相关

11 篇文章 2 订阅

订阅专栏

自然语言处理

10 篇文章 1 订阅

订阅专栏

系统功能：

分词、词性标注、关键词提取、文本分类；

系统实现：

分词：使用jieba中文分词（去停用词，精确模式）；

词性标注：使用jieba库里的posseg包进行词性标注；

关键词提取：使用tfidf的最合适前六个词；

文本分类：给复旦预料数据进行分词，生成词向量，装袋（词袋模型），接着训练集训练，多次调参，具体参数注释和代码中有，然后再选择相应测试预料进行测试，用的是skleran库的多项式朴素贝叶斯算法。（有参考其他博客）

图形界面：

import tkinter as tk

使用python内置的tkinter库作图进行交互。

打开本地文件按钮的实现方法：

window.mainloop()

必须要加这一句才能正常运行界面程序，大概是启动并持续刷新的意思。

具体代码（没有实现颜色的）：

清屏：

关于打开ansi编码的txt文件并正常读取（utf-8）的方法：

关于前三个基本功能的实现：

关于关键词抽取：

　　　　参数解释：
　　　　　　(1)sentence ：待提取的文本；
　　　　　　(2)topK ：返回K个权重最大的关键词
　　　　　　(3)withWeight ：是否返回权重
　　　　　　(4)allowPOS ：是否仅包括指定词性的词

关于ui输入框获取数据传到后台的方法：

e是输入框变量。

关注

2
点赞
踩
8

收藏

觉得还不错? 一键收藏
0
评论
python3.6-制作一个含有NLP基本功能系统（Windows exe）自然语言处理系统

系统功能：分词、词性标注、关键词提取、文本分类；系统实现：分词：使用jieba中文分词（去停用词，精确模式）；词性标注：使用jieba库里的posseg包进行词性标注；关键词提取：使用tfidf的最合适前六个词；文本分类：给复旦预料数据进行分词，生成词向量，装袋（词袋模型），接着训练集训练，多次调参，具体参数注释和代码中有，然后再选择相应测试预料进行测试，用的是skleran库的多项式朴素贝叶斯算法。（有参考其他博客）图形界面：...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。