【机器学习应用】【Pyhton】K近邻算法(KNN)

【机器学习应用】【Python】K近邻(KNN)

mglearn

在开始之前再介绍一个机器学习算法的工具包mglearn,是《Introduction to Machine Learning with Python》整本书使用的一个工具包,拥有许多可视化的模块帮助我们理解算法,完整代码参考github

安装mglearn参考set up

# 终端安装
pip install mglearn

# Jupyter Notebook安装
!pip install mglearn

K近邻简介

K近邻算法是一种适用于回归和分类的机器学习算法,它的基本原理是根据距离某一个数据点最近的k个数据的类别对其进行分类。例如,当k=1时,对于一个数据点,KNN算法会将其分类为离它最近的第一个数据的类别。

mglearn.plots.plot_knn_classification(n_neighbors=1)
在这里插入图片描述
通常计算数据点和周围数据的距离方法有三种:

  1. 欧氏距离(Euclidean distance)
  2. 曼哈顿距离(Manhattan distance)
  3. 明可夫斯基距离(Minkowski distance)

如何使用KNN

以乳腺癌数据集load_breast_cancer为示例:

from sklearn.datasets import load_breast_cancer
from sklearn.model_selection import train_test_split
from sklearn.neighbors import KNeighborsClassifier

cancer_data = load_breast_cancer()
X_train, X_test, y_train, y_test = train_test_split(cancer_data.data, cancer_data.target, random_state=42)

# 创建一个KNN模
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值