深度学习系列（3）——使用神经网络去辨识手写数字

最新推荐文章于 2025-04-22 14:01:02 发布

hanranV

最新推荐文章于 2025-04-22 14:01:02 发布

阅读量5.4k

点赞数

分类专栏：深度学习文章标签：深度学习神经网络图像处理

本文链接：https://blog.csdn.net/eddy_zheng/article/details/50700506

版权

深度学习专栏收录该内容

13 篇文章

订阅专栏

1、人脑的数字辨识

人脑的视觉系统可以说是世界的奇迹之一，看下面一行数字：
这里写图片描述
你会觉得你毫不费力地看出了它是 50419 ，其实识别的过程并不简单。人类大脑的每个半球中，有一个初级视觉皮层，V1区，约含有1亿4000万个神经元，它们之间的连接数更是达到了数百亿。然而，人的视觉不仅仅只是V1，整个一系列的视觉皮层还有 V2、V3、V4和V5，这些都做着更复杂的图像处理。如果大家对这方面想有更深入的了解，可以去看看这本书：神经计算原理/(美) Fredric M. Ham, Ivica Kostanic著叶世伟, 王海娟译

2、计算机视觉模式识别-神经网络

1）视觉模式识别的难度显而易见，现在如果让你尝试写一个计算机程序，以识别数字，你会觉得无从下手。神经网络以不同的方式解决问题。这个想法是采取大量的手写体数字，称为训练实例，然后开发一个系统，可以学习这些训练实例。换句话说，神经网络通过实例来自动推断识别手写数字的规则。此外，通过增加训练实例的数量，网络可以了解更多的手写规则，从而健壮网络提高其准确性。

这里会有一个很有趣的问题，你是否觉得训练样本足够多就能实现人工智能。

2）后续将编写一个程序实现一个神经网络，学习识别手写数字。程序只需74行长，并无使用其他神经库，但这个简短的程序可以识别的数字精度超过百分之96。在后续的博客中，改进方法，可以提高精度超过百分之99。

这里之所以用手写识别实例，因为它是一个很好的原型问题，可以作为我们学习的切入点，起始点。手写数字识别的确是具有挑战性，但它并没有想象中的那么困难，但你需要先构思一个解决方案，你的电脑要有很好的计算能力。我们会反复地回到手写识别的问题。在后面的学习中，我们将讨论如何将这些思想应用于计算机视觉中的其他问题，以及在语言、自然语言处理和其他领域中的应用。

3）当然，如果只写一个程序来识别手写体数字，那么博文将非常简短，对于初学者可能并不理解其中应用的理论思想！这一过程中，会设计很多神经网络的核心思想，包括2类重要类型的人工神经元（感知器和乙状结肠神经），以及神经网络的标准学习算法，称为随机梯度下降法（这个不了解的，建议去学习ufldl,链接地址：http://ufldl.stanford.edu/wiki/index.php/UFLDL%E6%95%99%E7%A8%8B）。在整个过程中，我将着重于解释为什么这样做，这和我们的神经网络区别及相似之处。在这样一个循序渐进的讨论、交流式的学习中，更深的理解神经网络，相信大家定将获益匪浅。最终理解的深度学习是什么，以及为什么它很重要。

瞎掰了几大段了，再接下来就是理论干货了，终于能进入正题了。