weka机器学习实战_Weka — Java机器学习算法集合的接口

weka机器学习实战

本文是机器学习系列的一部分。 我们的第四位专家是新西兰怀卡托大学计算机科学副教授Eibe Frank博士。 在本文中,他讨论了Weka并揭示了它的内幕。

什么是维卡?

Weka背后的想法是为Java中的机器学习算法集合提供统一的接口。 这包括图形用户界面,命令行界面和API。

Weka是用Java实现的,但是有一些用于Weka的软件包,它们允许使用Python编写的代码,R也可以从Weka中使用。 也可以使用Groovy或Jython编写Weka脚本。 Weka的开发始于1997年,那时Java还很年轻(而且很慢)。 最新版本的Weka 3.8需要Java 7或更高版本。 Weka的优势在于分类,因此需要对数据进行自动分类的应用程序可以从中受益,但它还支持聚类,关联规则挖掘,时间序列预测,特征选择和异常检测。

如何在Java代码中使用Weka

是一个如何在Java代码中使用Weka的示例。 可以在此处找到另一个示例-它在存储在ARFF文件中的数据集上训练朴素的贝叶斯分类器。 ARFF是Weka的默认数据格式,但也支持许多其他数据格式,包括CSV文件。 也可以从数据库中提取数据。

一个更有趣的例子是这个 。 它通过使用所谓的词袋模型表示用户指定的文本来应用文本分类。 词袋表示法是通过应用Weka的StringToWordVector过滤器获得的。 然后,在词袋数据上运行决策树学习器J48。

Weka的计划

Weka 3.8具有软件包管理系统,我们希望Weka现在将主要通过提供新软件包,提供新的学习算法和可视化工具来扩展。 我们目前不打算对基本系统进行任何重大更改。

机器学习:入门资源

IH Witten等人的“数据挖掘:实用的机器学习工具和技术”是对实用机器学习的简要介绍。 该书的第四版将于今年晚些时候发行,其中包含有关深度学习和概率建模的材料。 免责声明:我是其中的合著者之一。

机器会统治世界吗?

据我所知,没有人甚至可以解决意识的奥秘。 只要机器仅按照所告知的去做,无论这是否基于使用机器学习来优化性能,只要我们能够防止统治精英滥用机器,我们就应该是安全的。

我们要求Eibe Frank完成以下句子:

在50年的时间里,机器学习将无处不在。
如果机器变得比人类更智能,则后者将需要寻找新的自我占据方式,因为许多工作将消失。
与人类相比,机器永远不会 ……人类是生物机器,因此我无法完成这句话。
没有机器学习的帮助,人类将永远无法 (能够)利用当今收集的大量数据中的所有有用信息。


翻译自: https://jaxenter.com/weka-collection-of-ml-algorithms-java-128964.html

weka机器学习实战

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值