【Weka】Weka工具包

最新推荐文章于 2024-08-21 08:39:05 发布

dominic_z

最新推荐文章于 2024-08-21 08:39:05 发布

阅读量1k

点赞数

分类专栏：机器学习与数据挖掘

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/dominic_z/article/details/82763900

版权

机器学习与数据挖掘专栏收录该内容

12 篇文章 0 订阅

订阅专栏

用久了scikitlearn，突然换回weka各种不适应

weka的tree分类器输出的树后面的括号的含义

在这里插入图片描述

调用API对样本进行分类

在分类问题中，当调用如下代码对testInstance进行分类，输出的是一个double，预测的结果是一个index，假设预测结果为0.0

double index = classifier.classifyInstance(testInstance)

假如训练arff文件中的label字段是如下

@attribute label {1,-1}

那么index=0.0的意思就是：模型预测结果为1

又假如训练arff文件中的label字段是如下

@attribute label {-1,1}

那么index=0.0的意思就是：模型预测结果为-1

distributionForInstance函数同理，输出的double[]代表后验概率，与训练集中的类标签顺序是一一对应的
虽然这两个函数的输出不会受到测试数据集的影响，但假如你的训练数据中的label字段是如下

@attribute label {1,-1}

而测试数据的Instances对象的label字段是如下

@attribute label {-1,1}

并且假如此时index=0.0，也就是说模型预测的类为1

double index = classifier.classifyInstance(testInstance)

但是下面的代码并不会把testInstance的类设置为1，而是会设置为-1，因为下面的代码会受到Instances对象自身的label字段的顺序影响

testInstance.setClassValue(classifier.classifyInstance(testInstance))

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

博客等级

码龄8年

84
原创

42
点赞

147
收藏

23
粉丝

关注

私信

热门文章

分类专栏

综合 7篇
Linux 2篇
数据库 3篇
容器 2篇
大数据 5篇
分布式 1篇
消息队列 1篇
Spring 5篇
文本编辑 2篇
Java 25篇
机器学习与数据挖掘 12篇
Python 11篇
Scala 5篇
CPP 1篇
web开发 12篇

最新评论

【Python】积累与发现
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)提升标题与正文的相关性。
【Spring-Framework】积累与发现
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)提升标题与正文的相关性。
【CSS】积累与发现
CSDN-Ada助手: 如何在 CSS 中实现多列布局？
【HTML】积累与发现
CSDN-Ada助手: Vue.js和React.js你觉得哪个好？
【数学知识】积累与发现
CSDN-Ada助手: 什么是计算机视觉？

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。