ML_KNN
需要的数学定义:
- m为样本总个数;
- K为最邻近的个数;
- Y为所有标签的集合,总个数为 n;
- l l 为具体的一个标签,默认为标签 1;
- X 为一个实例;
-
为实例 X所对应的标签集合;
Yx Y x 是实例x 的标签向量,是1*n的one-hot行向量,元素所对应的标签若为1,则该实例有标签;
N(x) 为实例x的k个最邻近的个体。
然后可以得到输入的实例的所对应的K个邻居的标签信息:Cx(l)=∑YXn XnϵN(x) C x ( l ) = ∑ Y X n X n ϵ N ( x )其中 Cx(l) C x ( l ) 是一个 1*n 的向量,每一元素指对于该标签,X实例的K个邻居中有多少个拥有这个标签。
具体操作
对于一个实例X,首先得到它的K个邻居的集合 N(x),定义 H