规则集的生成方法大致有两种,一种是通过决策树之类的算法派生,就不多说了。另一种通过顺序覆盖的方式直接产生,不过这样就容易产生一个问题,就是同样的数据集因为数据记录处理的次序不同,造成产生的规则集不一致。这是因为每次产生一个规则后,都会删除该规则覆盖的数据元,而且有些规则是可以相互替代的(特别是支持度和置信度都相同的规则,如拥有别墅或具备高档轿车之类的规则前件),即使小的数据集都有可能产生不同的规则。但有趣的是通常不会影响预测的结果,尤其对没有缺失值的数据记录进行预测不会有任何影响。
双机模型数据挖掘软件套件研发心得之飘忽的规则集
最新推荐文章于 2024-08-05 20:49:33 发布