WEKA( OneR,过拟合)

 

OneR创建所谓的一层决策树,或者一组只检测某个属性的规则,一棵只在根节点根据某个属性值分叉的树,或者,一组只检测某个属性值的规则,一个属性一个分支。(也就是用一个属性来决策)

打开天气数据集

会发现是以outlook属性来划分

删除outlook属性再试一次

这次以湿度来划分

以上是用OneR默认设置划分的,点击设置分类

minBucketSize改为1

出现很多分叉,过拟合

打开diabetrs数据集

数字性数据集

选择ZeroR计算数据集的集线数据

OneR

minBucketSize决定模型的复杂度

做交叉验证,OneR准确率远高于基线准确率(基于plas)

改变为1

交叉验证准确率降低(基于pedi)

尝试用训练集

不能因为尝试了很多机器学习方法,就期望在新的数据集上取得相同效果,尝试很多,最终选择可能过拟合。使用交叉验证,得到的结果也不够,在这种情况下,把数据分为训练数据、测试数据和验证数据,使用训练和测试数据来选择机器学习方法,选择最适合训练的和测试的,或者使用交叉验证选择最适合训练数据的。选择好机器学习方法后,再使用验证数据来评估他针对的测试数据的真实效果。 

 

 

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Clark-dj

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值