【浅析机器学习01】KNN入门

1 什么是KNN

KNN英文全称:K-Nearest Neighbors。顾名思义,这是一种利用K个近邻来做预测的算法。古语有云,“物以类聚人以群分”,你周围大部分是什么样的人,那么你大概率也会是同样的人。

样本预测也是类似。我们计算待预测样本与已知样本数据之间的距离,然后根据已知样本数据的类别来估计带预测样本的类别。这就是KNN算法的核心了。

是不是很简单?下面让我们来看一个例子。

如下图所示,假设我们要预测某人面试是否能够拿到offer。那么我们已经拥有一些数据,记录了候选人的工作年限、薪资和是否拿到了offer的情况。给定一条新样本数据预测这个候选人是否能够拿到offer。应该怎么做呢?

思路很简单。大致分以下几步。

Step1.计算待预测样本和已知样本点之间的距离。

Step2.选出和带预测样本点距离最近的k个样本点。

Step3.统计这k个样本点的所属的类别标签。标签数最多的那个类别,就是带预测样本的类别。

from sklearn import datasets
from collections import Counter  # 为了做投票
from sklearn.model_selection import train_test_split
import numpy as np

# 导入iris数据
iris = datasets.load_iris()
X = iris.data
y = iris.target
# 划分训练集和测试集
X_train, X_
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值