Orange学习4-Constant模型的使用

每天都要丰富自己

已于 2022-11-28 22:04:43 修改

阅读量1.1k

点赞数 2

分类专栏：机器学习 # Orange学习

于 2022-11-28 22:03:10 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_39461079/article/details/128086492

版权

Constant模型分类问题回归问题预测精度平均值

关键词由CSDN通过智能技术生成

机器学习同时被 2 个专栏收录

6 篇文章 0 订阅

订阅专栏

6 篇文章 11 订阅

订阅专栏

目录

1. 什么是【constant】模型

2. 创建案例

2.1 分类问题1-泰坦尼克号数据集

2.2 分类问题2-鸢尾花数据集

2.3 回归问题-波士顿房价数据集

1. 什么是【constant】模型

Constant模型，也就是常量预测模型，使用到的学习器learner 是多数/平均数算法（majority/mean learning algorithm），经过该学习器生成的模型始终预测的是一个常数值。

对于分类（classification）问题，它会返回多数类的相对频率。并且将所有的类分成多数类类如在泰坦尼克号的数据集中，遇难也就是No的样本数量为1490个，存活，也就是Yes的样本数量为711个，那么返回的数值应该是1409/（1490+711）=0.677。分类的结果都是No

如果存在两个或更多多数类时，分类器会随机选择预测类，但对于特定示例始终返回相同的类。如鸢尾花数据集，在鸢尾花数据集中，一共150个样本，分为了三类，每类150个。因此返回的数值是50/150是0.33

对于回归（Regression）问题，返回值是所需要预测的Target的平均值

2. 创建案例

2.1 分类问题1-泰坦尼克号数据集

将泰坦尼克数据集在【File】模块中进行导入，并拖拽如下图所示的模块

双击【Test and Score】模块，得到如下结果：

CA准确率仅为0.677

双击【Predictions】模块，得到如下结果：

由于返回的是多数类，No的样本数量更多，拖动右侧的向下滑动，可看出，该模型将所有的样本均预测为了No。

在【Constant】下方显示的是：

0.68：0.32 —>no 的意思是No和Yes的样本出现的概率为0.68：0.32，因此分类为No

2.2 分类问题2-鸢尾花数据集

同样的，将鸢尾花数据集在【File】模块中进行导入，并拖拽如下图所示的模块

双击【Test and Score】模块，得到如下结果：

CA准确率仅为0.22

双击【Predictions】模块，得到如下结果：

由于返回的是多数类，三个样本数量一样，拖动右侧的向下滑动，可看出，该模型将所有的样本均预测为了Iris-virginica。

在【Constant】下方显示的是：

0.33：0.33:0.33 —>no 的意思是三类鸢尾花的样本出现的概率为0.33：0.33：0.33，随机选择分类Iris-virginica，将所有的样本分为Iris-virginica

2.3 回归问题-波士顿房价数据集

同样的，将波士顿房价数据集在【File】模块中进行导入，并拖拽如下图所示的模块

双击【Test and score】模块，结果如下图所示：

R2的数值为-0.003

双击【Prediction】模块，结果如下：

发现所有的数值都被预测为了22.5，这也就是所有的MEDV的均值

双击【Scatter Plot】可看出，所有的MEDV对应的值为22.5

3. 总结

以上就是Constant模型的一个应用，可以看出，该模型的性能还是比较差的

每天都要丰富自己

关注

2
点赞
踩
4

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

每天都要丰富自己 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。