《Rule Induction with a Genetic Sequential Covering Algorithm》GeSeCo概要解读
背景
最近考虑“遗传算法”、“生成规则”等问题,国内搜了好长时间,类似的文章很少,或者泛泛而谈,所以拜读了这篇经典文章,并简要做笔记如下,限于时间,没有全文翻译。
摘要
本文提供了一种规则-适应度算法,并与其它规则学习算法进行了比较
介绍
就是介绍背景
下面开始GeSeCo
part 2
2.1 Monks-1问题
SEQUENTIAL_COVERING ALGOTITHM
remark:对于真实世界更多属性的问题,假设空间更大。
2.2 top-level description
接下来讲 LEARN ONE RULE
2.3 learn one rule
开始种群:p个随机生成的规则,每个规则:二进制bit,长度:19bits,每个规则有一个相对应的适应度值(描述规则质量)
统计原理提供了适应度函数基础。
公式:
这里 A ‾ \overline{A} A表示 N c / ( N + 1 ) N_c/(N+1) Nc/(N+1),A表示 N c / N N_c/N Nc/N,其中 N N N表示总样本数, N c N_c Nc表示识别正确样本数.
然后文章中讲了一大段为什么要用 A ‾ \overline{A} A(关键词:大样本,数据增加影响力)
2.4 stop function
stop when:
- 没有规则需要生成了,剩下的都是一类
- 适应度小于一个阈值(典型0.5)
part3
展示效果
结论
总结一下上面。