WEKA（ OneR，过拟合）

最新推荐文章于 2022-09-17 22:59:35 发布

Clark-dj

最新推荐文章于 2022-09-17 22:59:35 发布

阅读量702

点赞数

分类专栏： # 机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/dujuancao11/article/details/114295997

版权

# 机器学习专栏收录该内容

32 篇文章 5 订阅

订阅专栏

OneR创建所谓的一层决策树，或者一组只检测某个属性的规则，一棵只在根节点根据某个属性值分叉的树，或者，一组只检测某个属性值的规则，一个属性一个分支。（也就是用一个属性来决策）

打开天气数据集

会发现是以outlook属性来划分

删除outlook属性再试一次

这次以湿度来划分

以上是用OneR默认设置划分的，点击设置分类

minBucketSize改为1

出现很多分叉，过拟合

打开diabetrs数据集

数字性数据集

选择ZeroR计算数据集的集线数据

OneR

minBucketSize决定模型的复杂度

做交叉验证，OneR准确率远高于基线准确率（基于plas)

改变为1

交叉验证准确率降低（基于pedi）

尝试用训练集

不能因为尝试了很多机器学习方法，就期望在新的数据集上取得相同效果，尝试很多，最终选择可能过拟合。使用交叉验证，得到的结果也不够，在这种情况下，把数据分为训练数据、测试数据和验证数据，使用训练和测试数据来选择机器学习方法，选择最适合训练的和测试的，或者使用交叉验证选择最适合训练数据的。选择好机器学习方法后，再使用验证数据来评估他针对的测试数据的真实效果。

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

Clark-dj 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。