k近邻算法实现手写数字的识别和图片的分类

最新推荐文章于 2022-02-04 14:46:33 发布

huizhang0110

最新推荐文章于 2022-02-04 14:46:33 发布

阅读量1k

点赞数 1

分类专栏：深度学习 PYTHON 文章标签：算法

本文链接：https://blog.csdn.net/dfq12345/article/details/78289455

版权

本文介绍了K近邻（KNN）算法在手写数字识别和图像分类中的应用。首先讲解了最近邻分类器的基本原理，然后阐述了KNN算法的改进，即通过考虑最近的k个邻居进行类别决策。通过实例展示了如何将手写数字转化为一维向量，并使用KNN算法进行识别，同时提供了错误率的统计。最后，提到了使用简化图片进行KNN算法的实验分析。

摘要由CSDN通过智能技术生成

最近邻分类器的改进版-k近邻分类器

直接根据距离最近这一个判断条件就推断出测试数据的类别有点武断，有可能这个距离最近的数据是一个非常奇葩的数据。我们放大范围，选择最近的k个已知类别的数据，由这些数据投票决定这个未知的数据的类别。也就是说距离测试数据最近的k个训练数据中类别频率最高的类别就是这个测试数据的类别。
如图所示：这里写图片描述判断问号位置的点的类别，就看周围点的类别，如果k=3的话，这三个距离最近的点投票决定问号位置点的类别为三角形，如果k=5的话，最后判定结构就是正方形了。

使用nn算法和knn算法识别手写数字

将手写数字形成的二维图形转变位一维向量，使用欧式距离来评价两个向量直接的距离，nn算法直接返回最近邻向量的标签，knn算法对k个近邻向量的标签进行了一个统计，返回了出现频率最大的标签。最后统计出现错误的概率

main.py

import os
import numpy as np
from kNN import img_2_vec1, classify_nn, classify_knn


if __name__ == "__main__":
    # 用于测试的入口

    # 构造样本测试数据集合和对应标签
    tr_files =