机器学习----------------KNN算法----------分类---------原理和python代码实现

最新推荐文章于 2024-07-24 20:25:39 发布

西安人走哪都要吃泡馍

最新推荐文章于 2024-07-24 20:25:39 发布

阅读量269

点赞数

分类专栏：机器学习文章标签：算法 python 深度学习

本文链接：https://blog.csdn.net/data_curd/article/details/111322218

版权

直奔主题：

在这里插入图片描述

import numpy as np
import pandas as pd
#读取燕尾花数据集，header参数来指定标题的行，默认为0，如果没有标题，则使用None
data = pd.read_csv(r"iris.csv")
#显示前N行记录，默认值为5
#data.head(150)
#显示末尾的N行记录，默认值为5
#data.tail(10)
#随机抽取数据，默认为1行
#data.sample(100)
#修改样本的类型，
data["class"] = data["class"].map({
   "Iris-virginica" : 0, "Iris-setosa" : 1,"Iris-versicolor" : 2})
#删除不需要的某一列，修改完数据后，称为一个新的对象
datas = data.drop("sepallength",axis=1)
#删除不需要的某一列，在元数据上修改，修改之后还是元数据
#data.drop("sepallength",axis=1,inplace=True)
#查看数据集是否有重复 any()是返回全集是否有重复的数据集
data.duplicated().any()
#求行数   和其他语言一样  len()
#删除重复的记录
data.drop_duplicates(inplace=True)
#查看各个理性具有多少条记录
data["class"].value_counts()
data

class KNN:
    """使用python语言实现k紧邻算法（实现分类）"""
    def __init__(self,k):  #其中的k代表需要的几个邻居
        """初始化方法
        -----
        k : int 
            邻居的个数
        """
        self.k = k
    def fit(self,X,y):  #z在python中矩阵用大写字母表示，向量用小写字母表示
        """训练方法
        Parameters
        -----
        X:类型数据类型，形状为:[样本数量，特征数量]
            待训练的样本特征（属性）
        y:类数组类型：形状为：[样本数量]   X的样本数量和y样本的数量要保持一致
            每个样本的目标值（标签）
        """
        #将X y转换成array数组类型
        self.X = np.asarray(X)
        se

最低0.47元/天解锁文章

西安人走哪都要吃泡馍

关注

0
点赞
踩
8

收藏

觉得还不错? 一键收藏
0
评论
机器学习----------------KNN算法----------分类---------原理和python代码实现

直奔主题：import numpy as npimport pandas as pd#读取燕尾花数据集，header参数来指定标题的行，默认为0，如果没有标题，则使用Nonedata = pd.read_csv(r"iris.csv")#显示前N行记录，默认值为5#data.head(150)#显示末尾的N行记录，默认值为5#data.tail(10)#随机抽取数据，默认为1行#data.sample(100)#修改样本的类型，data["class"] = data["class
复制链接

扫一扫

专栏目录