关于逻辑回归完成手写数字识别的一点愚蠢错误回顾

最新推荐文章于 2023-01-17 15:32:25 发布

无敌益

最新推荐文章于 2023-01-17 15:32:25 发布

阅读量214

点赞数 1

文章标签：神经网络机器学习逻辑回归

本文链接：https://blog.csdn.net/m0_61865481/article/details/120679089

版权

在机器学习课程作业中，作者通过神经网络和逻辑回归完成手写数字识别。在使用逻辑回归时，遇到因数据预处理不当导致的矩阵维度错误。通过分析，发现问题是由于书中代码将训练数据一维化并zip处理，实际数据应为(50000, 784)，而非(50000, 2)。解决方法是去除多余的数据预处理步骤，并调整数据集大小以适应逻辑回归的多分类需求，最终成功运行并得出结果。" 37756719,2901853,Android GPS定位获取地名实战,"['Android开发', 'GPS', '定位']

摘要由CSDN通过智能技术生成

最近的机器学习课上作业里要我们完成通过神经网络和逻辑回归进行手写数字的识别任务，神经网络的部分通过课上的辅助教材：

神经网络与深度学习

其中所提供的代码足以完成，另外这本书真的写的很好，在易读性与理解性上在我看来要胜过西瓜书，非常值得推荐！！

书中代码链接我也放在这里：https://github.com/mnielsen/neural-networks-and-deep-learning/blob/master/src/network.py

当开始完成应用逻辑回归进行手写数字识别时，由于涉及到LogisticRegression的多分类问题，我在网上搜索了一些相关的代码进行学习与参考，以下是源代码：

https://www.jianshu.com/p/ecb908e7a2d7

由于此处代码所使用的数据集采用的是matlab的加载格式mat，而我们作业中限定的是书中代码所使用的数据集mnist.pkl.gz，起初我直接使用了书中的数据预处理部分代码如下：

但如果直接将书中的数据集处理方式代入简书里的代码时，会报矩阵乘法中矩阵维度不匹配的错误，刚开始我以为仅仅是源代码的问题，反复调整过矩阵相乘部分的代码，但仔细阅读简书中代码的数据处理时发现，它所使用的数据集是(5000，400)，也就是一共有5000条数据，每条数据的维度为20*20，但有意思的是，如果我们print一下书中数据预处理后的结果时，我们会发现书中的代码居然是(50000，2)，其中的2是由于经过了zip()函数处理，导致一部分是测试数据的inputs，另一部分则是测试数据的results，但实际上mnist.pkl数据维度应该是28*28=784，这里感觉是被数据预处理(x $_{1}$ ,x $^{_{2}}$ ,...,x $_{784}$ )整个视作一个维度了，但这样处理之后不符合我们简书中代码输入数据形式的要求。