在《分类:基于规则的分类技术》中已经比较详细的介绍了基于规则的分类方法,RIPPER算法则是其中一种具体构造基于规则的分类器的方法。在RIPPER算法中,有几个点是算法的重要构成部分,需要强调一下
- 规则排序方式
RIPPER算法中采用的仍然是基于类的规则排序方式,不过独特的地方是,它先将各个类按频率(即类中包含的样本占总样本数的比例)从低到高排序,设是排序后的类,
是最不频繁的类,
是最频繁的类,按照《分类:基于规则的分类技术》中介绍的规则生成方法,生成类
的规则,直至剩下类
,然后类