多目标高效用关联规则_学习笔记（基于多目标）

最新推荐文章于 2025-03-27 16:30:45 发布

Erpim

最新推荐文章于 2025-03-27 16:30:45 发布

阅读量1.5k

点赞数 3

分类专栏：关联规则文章标签：多目标高效用关联规则

本文链接：https://blog.csdn.net/qq_35414569/article/details/79700107

版权

关联规则专栏收录该内容

4 篇文章

订阅专栏

前言

本篇博客出于学习交流目的，主要是用来记录自己学习多目标优化中遇到的问题和心路历程，方便之后回顾。过程中可能引用其他大牛的博客，文末会给出相应链接，侵删！

REMARK：本人菜鸟一枚，如有理解错误还望大家能够指出，相互交流。也是第一次以博客的形式记录，文笔烂到自己都看不下去，哈哈哈

这篇学习笔记关于一种基于多目标进化算法的高效用频繁项集挖掘算法。
参考文献：A Multi-Objective Evolutionary Approach for Mining Frequent and High Utility Itemsets
论文中涉及多目标进化算法部分可以参考我写的多目标优化学习笔记，里头有比较详细的理解说明。

正文

论文贡献：不需要指定类似最小支持度或者最小效用值之类的先验参数，只需运行一次
高效用频繁模式挖掘特点：低支持度的项集通常有较高的效用值
论文将频繁度和效用值同时作为目标项集的评价分量，运用多目标优化的方法进行频繁项集挖掘

MOEA-FHUI算法

算法框架如下图所示
这里写图片描述

首先，将事务集用one-hot编码（出现位置为1，否则为0）表示，并定义效用值和支持度为评估函数的两个目标分量。这里只用考虑Item，而不用考虑内部效用值，即出现次数；因为之后的评估指标是统计整个 $\mathcal{D}$ 。在这个问题中，由于考虑效用值和频繁度，所以我们考虑两个分量。MOEA/D算法相关可以查看多目标优化学习笔记（三）MOEA/D，这里默认大家都了解了。

设置好算法的pop(权值向量的个数)、邻集大小、个体重组率和突变率等参数。
Step1：种群初始化
1)用特殊问题策略进行初代种群的生成；

为了避免随机初始化产生许多无用的解，作者设计了一个初始化策略：
1.生成的个体必须是在交易集中的存在的，否则是无意义的；
2.通过交叉变异得到的子个体的生成尽可能有效并且多样；
从 $\mathcal{D}$ 中得到两类数据集，一类是transaction-itemset，即出现在 $\mathcal{D}$ 中的每条transaction；另一类是meta-itemset，只包含一个item。
对每个meta-itemset计算 $supp（M_{i}）$ ，然后计算支持度总和 $supp\left ( M \right )=\sum _{i=1}^{\left | \mathcal{I} \right |}supp\left ( M_{i} \right )$ ，于是对每个meta-itemset我们可以得到 $\frac{supp\left ( M_{i} \right )}{supp\left ( M \right )}$ ；同理，对于每个transaction-itemset我们可以计算的到 $\frac{util\left ( t_{i} \right )}{util\left ( \mathcal{D} \right )}$ 。
然后根据这两个指标从 $\mathcal{D}$ 进行随机选择子样本，从meta-itemsets中选 $\frac{N}{2}$ ，从transaction-itemsets中选 $\frac{N}{2}$ 。