一,LLE思想求得权重系数
LLE假设数据在较小的局部是线性的,也就是说,某一个数据可以由它邻域中的几个样本来线性表示。
那么假如有一个样本
x
1
\pmb{x}_1
xxx1,用 k-NN 思想找到和它最近的三个样本
x
2
,
x
3
,
x
4
\pmb{x}_2, \pmb{x}_3, \pmb{x}_4
xxx2,xxx3,xxx4,我们就假设样本
x
1
\pmb{x}_1
xxx1 可以由
x
2
,
x
3
,
x
4
\pmb{x}_2, \pmb{x}_3, \pmb{x}_4
xxx2,xxx3,xxx4 线性表示,即:
x
1
=
w
12
x
2
+
w
13
x
3
+
w
14
x
4
\pmb{x}_1=w_{12}\pmb{x}_2+w_{13}\pmb{x}_3+w_{14}\pmb{x}_4
xxx1=w12xxx2+w13xxx3+w14xxx4
为了找到其中线性关系的权重系数,可以用均方差作为回归问题的损失函数:
J
(
W
)
=
∑
i
=
1
m
∣
∣
x
i
−
∑
j
∈
Q
(
i
)
w
i
j
x
j
∣
∣
2
2
(1)
\pmb{J}(W) = \sum^m_{i = 1}||\pmb{x}_i - \sum_{j\in{Q(i)}}w_{ij}\pmb{x}_j||^2_2 \tag1
JJJ(W)=i=1∑m∣∣xxxi−j∈Q(i)∑wijxxxj∣∣22(1)其中
Q
(
i
)
Q(i)
Q(i)表示
i
i
i 的k个近邻样本脚标的集合。
通过上述式子可以得到权重系数
W
1
=
(
w
12
,
w
13
,
w
14
)
T
W_1=(w_{12}, w_{13}, w_{14})^\mathrm{T}
W1=(w12,w13,w14)T。
二, 通过网络得到对应标签分布
通过网络分别预测出样本 x 1 , x 2 , x 3 , x 4 \pmb{x}_1, \pmb{x}_2, \pmb{x}_3, \pmb{x}_4 xxx1,xxx2,xxx3,xxx4 对应的标签分布 y 1 , y 2 , y 3 , y 4 \pmb{y}_1, \pmb{y}_2, \pmb{y}_3, \pmb{y}_4 yyy1,yyy2,yyy3,yyy4。
三, 重构标签
假设在流形空间中,样本空间的线性关系与标签空间中的线性关系相似,则根据样本中求得的权重系数,并且设定一个参数
λ
\lambda
λ ,来得到新的标签
y
1
′
\pmb{y}_1'
yyy1′:
y
1
′
=
λ
y
1
+
(
1
−
λ
)
(
w
12
y
2
+
w
13
y
3
+
w
14
y
4
)
\pmb{y}_1'=\lambda{\pmb{y}_1}+(1-\lambda)(w_{12}\pmb{y}_2+w_{13}\pmb{y}_3+w_{14}\pmb{y}_4 )
yyy1′=λyyy1+(1−λ)(w12yyy2+w13yyy3+w14yyy4)