1. K近邻算法
输入:训练数据集
T={
(x1,y1),(x2,y2),⋯,(xN,yN)}
其中, xi∈χ⊆Rn 为实例的特征向量, yi∈Y={ c1,c2,⋯,cK} 为实例的类别, i=1,2,⋯,N; 实例特征向量x;
输出:实例x所属的类y。
(1)根据给定的距离度量,在训练数据集T中找出与x最近邻的k个点,涵盖这k个点的x的邻域记做 Nk(x);
(2)在 Nk(x) 中根据分类决策规则(如多数表决)决定x 的类别y:
y=argmaxcj∑xi∈Nk(x)I(yi=cj),i=1,2,⋯,N;j=1,2,⋯,K
上式中,I为指示函数,当 yi=c<