knn学习+手撕代码

最新推荐文章于 2024-07-13 22:36:10 发布

北向晴

最新推荐文章于 2024-07-13 22:36:10 发布

阅读量193

点赞数

文章标签：机器学习 python

本文链接：https://blog.csdn.net/qq_36238499/article/details/119653840

版权

	以代码为导向的knn步骤：
	1.数据集x,y赋值，x为特征数据，y为分类标签数值化数据
	2.使用train_test_split函数划分训练集测试集x_train,x_test,y_train,y_test
	3.计算测试集中每个样本和训练集中的每个样本的距离（一般是欧氏距离）
	4.对距离进行排序，提取前k小的样本的索引值
	5.根据索引值获得这k个样本的分类标签
	6.计算k个样本中各标签的数量，选择比例最多的标签作为该样本的分类

具体代码（来自github）

from __future__ import print_function, division
import numpy as np
import math
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split  # 切分数据集为训练集和测试集
from sklearn.metrics import accuracy_score  # 计算分类预测的准确率


class KNN():
    """ K Nearest Neighbors classifier.
        k近邻分类器
    输入参数:
    -----------
    k: int
        选择的近邻的个数
    """
    def __init__(self, k=

最低0.47元/天解锁文章

北向晴

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
knn学习+手撕代码

以代码为导向的knn步骤： 1.数据集x,y赋值，x为特征数据，y为分类标签数值化数据 2.使用train_test_split函数划分训练集测试集x_train,x_test,y_train,y_test 3.计算测试集中每个样本和训练集中的每个样本的距离（一般是欧氏距离） 4.对距离进行排序，提取前k小的样本的索引值 5.根据索引值获得这k个样本的分类标签 6.计算k个样本中各标签的数量，选择比例最多的标签作为该样本的分类具体代码（来自github）from __future__ i.
复制链接

扫一扫