2014年9月6日 笔记
规则就是模版,就是过滤器,就是对属性或者特征进行过滤操作,过滤操作的结果就是判断最后是不是符合规则,即,通过过滤完成了一次分类操作。
通过对分类结果,再进行一次过滤操作,得到新一层级的分类,然后再对分类结果,再进行一次过滤操作,.....如此反复,直到完成任务。
程序中的各种if判断,可以看作是过滤和分类同时操作。
过滤和分类很类似。
如果非要分清楚,过滤应该是分类之后,根据分类结果,又做了一次分类(一种导向指令的分类,比如剔除,删除,压缩,转换,或者其他操作)操作。
也就是说,过滤类似于卷积。
第一步,对数据集中的每一个数据进行分类操作,得到一个每个元素的分类集。这一步可以看做是map。
第二步,根据第一步中的分类集,执行相应的操作。这一步可以看作是reduce。
这个相应的操作是上面说的删除,转换,修改等操作。