Python-Iris鸢尾花数据Knn分类

最新推荐文章于 2022-03-21 15:33:54 发布

CCCCCCCCCCxy

最新推荐文章于 2022-03-21 15:33:54 发布

阅读量721

点赞数

文章标签：机器学习 python

本文链接：https://blog.csdn.net/qq_41822267/article/details/109407492

版权

Python-Iris鸢尾花数据Knn分类

首先导入sklearn库中自带Iris数据（三类：0：山鸢尾花、1：变色鸢尾花、2：维吉尼亚鸢尾花），训练集112个，测试集38个。

# 导入iris数据,X数据，y标签
iris = datasets.load_iris()
X = iris.data
y = iris.target
X_train, X_test, y_train, y_test = train_test_split(X, y, random_state=2003)

计算待分类样本与其余样本之间的欧式距离

#计算两个样本的距离
def distance(test1, test2):
    dist = np.sqrt(sum((test1-test2)**2))
    return dist

预测样本的标签：利用Counter统计出前k个样本中每一类的数目（从大到小）， count.most_common()可以将字典转换为list方便返回。

#一个样本knn分类结果标签
def knn(X, y, test, k):
   d = [distance(x, test) for x in X]
   knext = np.argsort(d)[:k]    #返回前k个最小的样本位置
   count = Counter(y[knext])
   return count.most_common()[0][0]   #返回最多的标签

最后，就是调用上面的两个函数预测Iris数据

pred = [knn(X_train, y_train, x, 3) for x in X_test]
print("测试集预测标签")
count=0
for i in range(len(pred)):
    print(pred[i],end="")
    count=count+1
    if count%10==0:
        print(end="\n")
correct = np.count_nonzero((pred == y_test) == True)
print("\n")
print("accuracy is: %.3f" % (correct / len(X_test)))

测试结果：38个测试集结果全部打印出来
在这里插入图片描述

CCCCCCCCCCxy

关注

0
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
Python-Iris鸢尾花数据Knn分类

Python-Iris鸢尾花数据Knn分类首先导入sklearn库中自带Iris数据（三类：0：山鸢尾花、1：变色鸢尾花、2：维吉尼亚鸢尾花），训练集112个，测试集38个。# 导入iris数据,X数据，y标签iris = datasets.load_iris()X = iris.datay = iris.targetX_train, X_test, y_train, y_test = train_test_split(X, y, random_state=2003)计算待分类样本与其余样本
复制链接

扫一扫