《数据挖掘-实用机器学习技术》读书笔记

1R算法是一种简单的机器学习技术,通过对单个属性进行测试并形成不同分支来建立规则。每个分支对应属性的不同值,类别为训练数据中最多的类别。算法通过计算错误率选择最佳属性规则集。对于残缺值和数值属性,1R将其视为类别处理。1R方法适用于处理数据集的多样化类别,通过限制样本数量和合并相同多数类的规则,提高效率。此外,我们还了解到决策树和关联规则在数据挖掘中的应用。
摘要由CSDN通过智能技术生成

  1. 1规则:1R

建立一个只对单个属性进行测试的规则,并进行不同的分支。每一个分支对应一个不同的属性值。分支的类就是训练数据在这个分支上出现最多的类。这种方法能够容易地计算出规则的误差率。只要计算在训练数据上产生的错误,即,统计不属于多数类的实例数量。

每个属性都能产生一个不同的规则集,每条规则对应这个属性的每个值。对每一个属性的规则集的误差率进行评估,从中选出性能最好的一个。一个属性对应一个规则集。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值