论文阅读报告：ReliefF for Multi-label Feature Selection，Newton Spolaˆor, 2013

lcg_magic

于 2020-12-16 18:56:51 发布

阅读量714

点赞数 2

分类专栏： Paper Reading

版权声明：本文为博主原创文章，遵循 CC 4.0 BY 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/PursueLuo/article/details/111285639

版权

机器学习论文特征选择

Paper Reading 专栏收录该内容

12 篇文章 2 订阅

订阅专栏

文章目录

1. 多标签知识
- 1.1 多标签数据（Multi-label data）
- 1.2 差异函数（Dissimilarity function）
2. 算法
3. 原文

1. 多标签知识

1.1 多标签数据（Multi-label data）

在这里插入图片描述

其中：

$D$ 是多标签数据集；

$X_j$ 是第 $j$ 个特征（属性）， $j=1,2,\dots,M$ ；

$\bm{x}_i = (x_{i1},x_{i2}, \dots, x_{iM})$ 是包含 $M$ 个特征的向量；

$L=\{y_1,y_2,\dots,y_q\}$ 是数据集 $D$ 的 $q$ 个可能标签；

$Y_i$ 是和 $\bm{x}_i$ 关联的标签集合， $Y_i \subseteq L$ ；

$E_i = (\bm{x}_i, Y_i)$ 是第 $i$ 个样本， $\dots, N$ ；

1.2 差异函数（Dissimilarity function）

使用汉明距离（Hamming Distance，HD）作为多标签 $Y_a$ 和 $Y_b$ 之间的差异函数。
记
$mld(E_a, E_b)=HD(Y_a,Y_b)$

两个集合（多标签）之间 HD 定义为 $\lvert Y_a \cup Y_b \rvert - \lvert Y_a \cap Y_b \rvert$ 。
它统计了 $Y_a$ 和 $Y_b$ 之间不同标签的数量。
假设， $Y_a=\{y_3,y_6\}$ ， $Y_b=\{y_1,y_4\}$ ，则 $HD(Y_a,Y_b)=4$ ；
又比如 $Y_a=\{y_2,y_3,y_5,y_6\}$ ， $Y_b=\{y_1,y_2,y_4,y_5\}$ ，则 $HD(Y_a,Y_b)=4$ 。

在这篇文章中，使用归一化的 HD
$HD(Y_a, Y_b) = \frac{\lvert Y_a \cup Y_b \rvert - \lvert Y_a \cap Y_b \rvert}{q}$

2. 算法

在这里插入图片描述
其中：

$W_{dY}$ 是标签之间的差异；

$W_{dX}$ 是属性值之间的差异；

$W_{dYX}$ 标签和属性值之间的差异；

$d(E_i,EK_z)$ 是距离权重；

$diff(X_j, E_i, EK_z)$ 计算了样本 $E_i$ 和 $EK_z$ 在特征 $X_j$ 上值的差异；

$W$ 代表最终特征的权重。

3. 原文

DOI 10.1109/BRACIS.2013.10

关注

2
点赞
踩
2

收藏

觉得还不错? 一键收藏
2
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。