绘画能力与计算机视觉
2011-6-2
最近看了一本教人绘画的书,《像艺术家一样思考》, 该书声称能让不会画画的人在几天时间内获得基本的绘画能力。总得来说,作者认为我们的大脑在观察世界时有两种模式,L模式和R模式,R模式观察了细节,而L模式根据我们的生活经验将观察到的细节进行了分析,从而达到了认识外部世界的目的。
作者认为,我们经过长期的生活训练,R模式被压抑着L模式之下,从而在绘图时,我们的信息是从L模式,即大脑进行加工后的信息得到的。在这种情况下,我们的绘画有着有趣的现象。例如在画人脸时,五官的比例比实际情况要大,眼睛在头部的上方(实际应该在中间位置)。另一种例子是各种背景图像可以有效的干扰到我们对物体位置和大小的判断,通过一些简单的线条或符号就可以“欺骗”大脑。在L模式下,我们没有办法得到正确的物体大小和比例,因为大脑为了后期的工作对图像进行的修改。
作者声称要解决这个问题,就需要放弃L模式,让大脑进入R模式工作方式,然后再训练手将大脑R模式下的图像忠实的绘制出来,就能得到了基本的绘画能力。
作者提出的一个有趣的方法是将绘画的摹本倒过来,L模式会因为识别困难而被大脑放弃,从而进入R模式工作,然后训练用手以极慢的速度,按照看到的图像(注意不是物体)绘制出来。根据作者的经验,所有的学生使用这种方式后的绘画都比以前绘画的水平有所提高。
DISCOVERY中报道过的白痴画家从另外一个方面验证了这个理论,这些白痴画家因为各种原因丧失了对日常物体的分辨和理解能力,其中包括对文字,人脸的辨别能力,但同时显示了惊人的绘画能力,有些人在参观城市后,能够将整个街景画下来,而且细节丝毫不落。有些人在看一眼写满文字的黑板后,就能够将所有的内容记录下来,就像一个照相机,而对其上的文字内容却一无所知。
因此可见,将图像绘制下来实际上是一种“底层”能力,而大多数人因为后天的识别能力的获取而渐渐丧失了这种能力,只能再次经过“反识别”的训练方式再次进入底层模式。这个过程正好像计算机视觉中“模式识别”的反向过程。在计算机系统中,摄像头能够毫不费力的得到视觉范围内的所有细节,但能够到达人类的识别能力却非常困难。
也许我们能够从这个反向过程中得到有些启发,为什么在L模式下我们对长度,比例等信息的掌握都很不准确,却能够轻而易举的识别出文字,物体,以及分辨人脸甚至表情。我们在幼儿时期是否就是一个不停采样的摄像机,而大脑将无数的样本保存起来,进行学习和分类,从而达到了L模式的能力。大脑到底对图像进行了怎样的加工,能否通过这些“反向过程”以及“欺骗过程”了解到L模式的学习过程和结果,从而帮助计算机模拟这个过程,从而达到或接近人类的识别能力。