自然语言处理——文本分类平台功能及UI设计

本文档详述了一款自然语言处理实验平台的功能与UI设计,包括语料分析、处理,英文支持,特征选择,分类器性能对比等功能。用户可配置工作空间,测试多种分类算法,进行参数调优,并观察演示效果。该平台适用于文本分类实验,支持词分布、文档长度等统计分析,提供灵活的实验配置选项。
摘要由CSDN通过智能技术生成

  本文档介绍我开发的自然语言处理——文本处理实验平台的系统功能及UI设计。大量实验都是基于本工具平台完成。

欢迎页面

在这里插入图片描述

语料分析

在这里插入图片描述
功能:简单统计语料类别下样本的分布情况,用饼图显示比例。可进一步增加其他详细的分析功能,如词分布分析,文档长度分析等。

语料处理

在这里插入图片描述
功能:

  • 通过选择的原始语料目录和分词方法,点击“开始分词”,分词将输出到制定路径。右下侧输出信息框会显示完成信息。
  • 通过分词结果,将本语料样本含有的词进行词典化,用于词文档矩阵的生成。
  • 构建词文档矩阵,通过点击“构建词文档”按钮,词文档输出到制定路径。
  • “输入文本”文本框可以输入文本或打开文件,测试观察各分词器的分词效果。

词文档矩阵格式如下:

评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值