机器学习与R语言_有监督学习_分类_规则学习概念

gee努力的数据分析师

于 2022-10-20 09:33:29 发布

阅读量287

点赞数

文章标签： r语言机器学习开发语言

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/hhhhhhhhhh23/article/details/127402127

版权

规则算法

概念

ZeroR:最简单的分类器或一种规则学习算法。即，对每一个未标记的案例，不考虑它党的特征值就把它预测为最常见的类；
OneR或1R：通过选择单一规则来提高ZeroR的性能的分类器。即，用唯一最重要的特征或错误率最低的特征来分类；（优点：可读，实践中表现好；缺点：没利用其他特征的信息）
IREP:第一次试图解决规则算法遇到大数据、噪声时的性能问题的算法；
RIPPER算法或重复增量修建（Repeated incremental pruning to reduce produce error reduction）:通过生长、修剪、优化生成多规则分类，采用“独立而治之的思想”（vs决策树“分而治之”）,及先贪婪地增加特征（same决策树的信息增益原则），直到能完全划出一个子集或用完所有属性，若不能再熵减该规则就立刻被修剪，最后再用探索法优化算法。(优点：性能甚至可能超过决策树，模型比决策树更简单，对大数据和噪声数据有效，模型可读；缺点：处理数值型不理想)。
IRPE++,.SLIPPER,TRIPPER....

来自决策树的规则

优：规则应用起来更简单

缺：1. 复杂；2. 有偏

此笔记来源于《机器学习与R语言》，加上了个人理解加工，仅作个人学习使用，若有侵权，请联系我们。

下期预告：

实战_识别有毒蘑菇

背景：需要一种简单可读的规则，用于无机器时人为判断，所以选用规则学习

gee努力的数据分析师

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
机器学习与R语言_有监督学习_分类_规则学习概念

规则算法的定义与演进，规则算法与决策树的比较
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。