直奔主题:
import numpy as np
import pandas as pd
data = pd.read_csv(r"iris.csv")
# 删除不需要的列
# 用drop可以删除一个字段,或者删除多个字段
# axis 为1表示列,为0表示行
# inplace = True 表示在现在这个数据源上修改结果,也称:就地修改
data.drop(["class"],axis = 1, inplace=True)
# 删除重复的记录
data.drop_duplicates(inplace=True)
KNN:
"""使用python实现K近邻算法(回归预测)
该算法用于回归预测,根据前3特征属性,寻找最近的K个邻居,
然后再根据K个邻居的第四个特征属性,去预测当前样本的第4个特征值
"""
def __init__(self,k):
"""初始化方法
Parameters
-----
k : int
邻居的个数
"""
self.k = k
def fit(self,X,y):
"""训练方法
Parameters
-----
X : 类数组类型(特征矩阵),形状为【样本数量,特征数量】
待训练的样本特征
y :类数组类型(目标标签),形状为【样本数量】
每个样本的目标值(标签)
"""