CH2 KNN分类算法

CH2 KNN分类算法

每个样本都可以用它最接近的K个邻居来代表,KNN是通过测量不同特征值之间的距离进行分类

2.1 算法图解

在这里插入图片描述

2.2 算法步骤

  • 输入: 训练样本 { x i , y i } i = 1 n \{x_i, y_i\}^n_{i=1} {xi,yi}i=1n,测试样本 x x x,近邻个数K,距离函数dist
  • 输出: 测试样本 x x x的预测类别 y y y
    1. 计算测试数据与各个训练数据之间的距离
    2. 按照距离的递增关系进行排序
    3. 选取距离最小的K个点
    4. 确定前K个点所在类别的出现频率
    5. 返回前K个点中出现频率最高的类别作为测试数据的预测分类

2.2.1 常用的距离度量方法

欧几里得距离
多维空间中各个点之间的绝对距离
d i s t ( X , Y ) = ∑ i = 1 n ( x i − y i ) 2 dist(X,Y) = \sqrt{\sum^n_{i=1}(x_i-y_i)^2} dist(X,Y)=i=1n(xiyi)2

明可夫斯基距离
欧式距离的推广,是对多个距离度量公式的概括性表述
d i s t ( X , Y ) = ( ∑ i = 1 n ∣ x i − y i ∣ p ) 1 p dist(X,Y) = (\sum^n_{i=1}|x_i-y_i|^p)^{\frac{1}{p}} dist(X,Y)=(i=1nxiyip)p1
p=2时得到欧式距离

曼哈顿距离
由明氏距离中p=1时得到的公式,将多个维度上的距离进行求和后的结果
d i s t ( X , Y ) = ∑ i = 1 n ∣ x i − y i ∣ dist(X,Y) = \sum^n_{i=1}|x_i-y_i| dist(X,Y)=i=1nxiyi

向量空间余弦相似度
s i n ( X , Y ) = c o s θ = x ⃗ ⋅ y ⃗ ∣ ∣ x ∣ ∣ ⋅ ∣ ∣ y ∣ ∣ sin(X,Y) = cos\theta = \frac{\vec{x}\cdot\vec{y}}{||x||\cdot||y||} sin(X,Y)=cosθ=∣∣x∣∣∣∣y∣∣x y

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值