Weka初体验——中文文本分类

本文介绍了如何在Weka环境下进行中文文本分类,包括Weka的下载、配置文件修改以支持中文、数据格式要求、分类训练以及如何使用libsvm。通过调整配置和数据预处理,使得Weka能处理中文文本,利用其强大的分类器进行训练,并探讨了在Java项目中集成Weka的可能性。
摘要由CSDN通过智能技术生成

最近在公司实习做电商评论相关的数据分析,需要调几个分类器,组里的代码一贯用Java编写,为了提高工作效率,找了找Java环境下的机器学习工具库,发现了Weka这个神奇的东西。

Weka介绍及下载

Weka是一个Java编写的具有10几年历史的开源机器学习与数据挖掘软件,曾获得SIGKDD颁发的数据挖掘领域内最高服务奖。

Weka软件的主页面

上面这张图就是Weka的主页面,GUI做得很简陋,但它的功能的确非常强大。而且它不仅可以通过GUI操作,还有CLI(command-line interface)命令行模式,而且因为它的源码使用java编写,所有它的jar包还可以导入java的工程中,直接调用api。

我们今天先简单分享一下在使用GUI的过程中遇到的一些问题。

我下载的是Weka官网上的3-7-12 64位不带Java VM的版本,大家可以点击这里直接下载这个版本的,也可以点击

  • 9
    点赞
  • 35
    收藏
    觉得还不错? 一键收藏
  • 8
    评论
评论 8
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值