前言
使⽤神经⽹络识别⼿写数字:
⼈类视觉系统是世界上众多奇迹之⼀。看看下⾯的⼿写数字序列:
⼤多数⼈毫不费⼒就能够认出这些数字为 504192。这么容易反⽽让⼈觉着迷惑了。在⼈类
的每个脑半球中,有着⼀个初级视觉⽪层,常称为 V1,包含 1 亿 4 千万个神经元及数百亿条神
经元间的连接。但是⼈类视觉不是就只有 V1,还包括整个视觉⽪层 —— V2、V3、V4 和 V5 ——
他们逐步地进⾏更加复杂的图像处理。⼈类的头脑就是⼀台超级计算机,通过数⼗亿年的进化
不断地演变,最终能够极好地适应理解视觉世界的任务。识别⼿写数字也不是⼀件简单的事。尽
管⼈类在理解我们眼睛展⽰出来的信息上⾮常擅⻓,但⼏乎所有的过程都是⽆意识地。所以,我
们通常并不能体会⾃⾝视觉系统解决问题的困难。
如果你尝试写出计算机程序来识别诸如上⾯的数字,就会明显感受到视觉模式识别的困难。
看起来⼈类⼀下⼦就能完成的任务变得特别困难。关于我们识别形状 —— “9 顶上有⼀个圈,
右下⽅则是⼀条竖线”这样的简单直觉 —— 实际上算法上就很难轻易表达出来了。⽽在你试着
让这些识别规则越发精准时,就会很快陷⼊各种混乱