K 近邻算法

k 近邻算法是一种分类算法

对于未知类别的点:

      1.计算已知类别的点到当前点中的距离(计算距离)

      2.按照距离以此排序(排序)

      3.选取与当前点距离最近的k个点(选K个点)

      4.确定前k个点的类别(确定类别)

      5.选取出现类别次数最多的点的类别,作为未知点的类别。

 

k 近邻算法的三个要素: k值的选取,距离度量,分类决策规则

k 近邻中如果出现样本不平衡。 解决方式:不同的样本赋予不同的权重。

 

1.预处理你的数据:对你数据中的特征进行归一化(normalize),让其具有0均值和单位方差。

2.输入数据是高维数据,考虑采用降维方法比如pca

3.将数据分为训练集和验证集,按照一般规律,70%-90%数据作为训练集

4.在验证集上调优,尝试足够多的k值,尝试L1和L2两种范数的计算方式

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值