k-近邻分类算法(1)

从样本中找与预测样本距离最近的k个数据

这k个数据所属类别投票决定了预测样本的类别

距离公式:

d a b = ∑ i = 1 m ∣ a i − b i ∣ n n d_ab=\sqrt[n]{\sum_{i=1}^m |a_i-b_i|^n} dab=ni=1maibin

余弦相似度:

c o s Θ = ∑ i = 1 m ( a i ∗ b i ) ∑ i = 1 m a i 2 ∗ ∑ i = 1 m b i 2 cos\Theta = \frac{\sum_{i=1}^m(a_i * b_i)}{\sqrt{\sum_{i=1}^m a_i^2}*\sqrt{\sum_{i=1}^m b_i^2}} cosΘ=i=1mai2 i=1mbi2 i=1m(aibi)

其中,a,b为包含m个属性的样本,属性计算时要进行规范化(最大最小值规范化或零均值规范化等)

其中 n=1 时曼哈顿距离,n=2是欧式距离,n $\to$ $\infty$ 是切比雪夫距离

最大值最小值规范化:

v = x − l r − l ( R − L ) + L v=\frac{x-l}{r-l}(R-L)+L v=rlxl(RL)+L

其中原来取值区间L,R,映射区间l,r,原值x,映射值v

零均值规范化:

v = x − μ A σ A v=\frac{x-\mu_A}{\sigma_A} v=σAxμA

其中 μ A \mu_A μA均值, σ A \sigma_A σA标准差,原值x,映射值v

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值