每天进步一点点 -- pytorch学习：MNIST手写数字初体验

最新推荐文章于 2024-06-17 21:23:48 发布

攀登程序猿

最新推荐文章于 2024-06-17 21:23:48 发布

阅读量576

点赞数

分类专栏：机器学习文章标签： python 算法开发语言

本文链接：https://blog.csdn.net/qq_45759288/article/details/128268445

版权

本文介绍了使用K近邻算法对手写数字进行识别的基础原理，包括特征值提取和数字识别的过程。接着，文章转向PyTorch实战，探讨了神经网络在MNIST数据集上的应用，数据集获取、模型选择、以及三层神经网络的构建。虽然没有详细展示代码实现和测试过程，但提到了训练过程中损失函数的变化。最后，文章解决了一个关于在Anaconda环境中安装matplotlib的问题。

摘要由CSDN通过智能技术生成

理论计算方法 -- K临近算法(OpenCV轻松入门_面向python)

K 近邻算法的本质是将指定对象根据已知特征值分类，根据书中给出的内容，我们可以在手写数字识别上进行分析。
假设我们要让程序识别图20-2中上方的数字（当然，你一眼就知道是“8”，但是现在要让计算机识别出来）。识别的方式是，依次计算该数字图像（即写有数字的图像）与下方数字图像的距离，与哪个数字图像的距离最近（此时k=1），就认为它与哪幅图像最像，从而确定这幅图像中的数字是多少。
从特征值提取和数字识别两方面展开介绍：

特征值提取

        步骤1：我们把数字图像划分成很多小块，如图20-3所示。该图中每个数字被分成5行4列，共计5×4=20个小块。此时，每个小块是由很多个像素点构成的。当然，也可以将每一个像素点理解为一个更小的子块。
        为了叙述上的方便，将这些小块表示为B（Bigger），将B内的像素点，记为S（Smaller）。因此，待识别的数字“8”的图像可以理解为：
        ● 由5行4列，共计5×4=20个小块B构成。
        ● 每个小块B内其实是由M×N个像素（更小块S）构成的。为了描述上的方便，假设每个小块大小为10×10=100个像素。

步骤2：计算每个小块B内，有多少个黑色的像素点。或者这样说，计算每个小块B内有多少个更小块S是黑色的。
        仍以数字“8”的图像为例，其第1行中：
        ● 第1个小块B共有0个像素点（更小块S）是黑色的，记为0。
        ● 第2个小块B共有28个像素点（更小块S）是黑色的，记为28。
        ● 第3个小块B共有10个像素点（更小块S）是黑色的，记为10。
        ● 第4个小块B共有0个像素点（更小块S）是黑色的，记为0。
以此类推，计算出数字“8”的图像中每一个小块B中有多少个像素点是黑色的，如图20-4所示。我们观察后会发现，不同的数字图像中每个小块B内黑色像素点的数量是不一样的。正是这种不同，使我们能用该数量（每个小块B内黑色像素点的个数）作为特征来表示每一个数字。