这是一篇关于机器学习中基于规则分类器的文章,主要讲如何实际的操作这个FOIL信息增益来得出一个规则集。
有几个问题:
1.在第执行外循环的时候,我写的是将原始表格P类中满足规则的元组去除。实际上是要将原始表格中P类和N类中满足规 则的元组去除,为什么没有写N类呢?因为这个题目中N类很特殊,N类中所有的元组基本上都符合规则。
2.在计算FOIL 的值的时候,一定要注意选取的是那一个表格的数据。一般来说,分类一次,就以分好 的这个表格为标准
3.在执行外循环的时候,分类是在最原始的那个表格重新分类。
以上是我个人的一些学习经验,这个学期刚刚开始接触,真的搞不懂很多很多内容,因此选择在这里发表自己会的,便于以后复习。有错的话,欢迎各位大佬教教我。
这篇文章借鉴了百度上的一篇文章,思路基本和上面一样,不过我将其整理了一下,方便理解。