视觉的科学

对于我们这些拥有视觉的家伙们来说,想当然就是把这个能力作为自然而然的。每一天,我们醒来的时刻,都是依靠着我们的视觉。但是,究竟我们的视觉系统是如何工作的呢?你有没有想过?我们怎么可能会能看见呢?

我们生活在一个三维世界里,这个世界非常复杂,各种比例也非常多。我们生活的星球,可以有阳光的照射,阳光照耀着世界,然后光线从这个世界反射回来,照射到视网膜上,这是眼球后面的一小块组织。我们看到了一个非常微妙的丰富的三维世界,而这一切都来自那一小块光敏细胞。如此微弱的输入是如何产生如此大量的关于世界的信息的

视觉是如何产生的

一开始你会说,相机都能做到拍摄风景,人眼做这事也是很简单的呀,就是接受光。

但是,实际上,相机压根没做什么事情,相比人的眼睛,相机只是捕捉阴影和色彩,然后投影到二维的平面上。但是人类的眼睛却能做更牛逼的事情:我们看到了一个二维的图像,但是却在感知一个三维的空间。

也就是说,人类通过一个平面的图片,看到了一个三维的图像

另外说一句,当你在看平面的相机相片时,相同的视觉系统也在工作,这个系统能为你解释照片里面的三维空间信息。

我们看看视觉系统是如何工作的

第一个步骤很简单

史蒂夫

通过一些光学的知识,相信你在初中的物理课学过 透镜成像。当光通过一个凸透镜时,就会被聚焦,这就是放大镜的原理。

我们人类的眼睛里面也有个凸透镜/放大镜 ,这个镜子跟相机的镜子很像,它会汇聚环境中的光,然后把这些光给聚焦到眼睛的视网膜上,我们的视网膜就在我们眼里的放大镜的后面不远处。

注意,聚焦到我们视网膜的图像是上下颠倒,(同时也是左右颠倒的?你觉得呢?)所以要进行一个翻转,这个过程不难,我们的脑子顺手就做了,相机也很好做,就像你自拍的时候,可以开启手机的镜像模式。

视觉系统的另外一个步骤,就比较重要了,就是知道物体的尺寸,这可比前面成像的步骤难多了。

用生活的经验,和物理学的知识,我们可以知道,物体的尺寸跟那玩意离我们多远有很大关系。两个一模一样的树,种的远,看起来就会比较小。
在这里插入图片描述

明明一样大小的树,你眼睛离前面的近,在视网膜上,前面的树,就大。

咱们能用一个精确的数学公式来表达 树的大小和 距离 关系

在这里插入图片描述

更远的树,在视网膜上的成像,就会越小。我们看不到平铺在视网膜的二维图像,而是自动会处理出一个具有空间感的三维世界。

两种刺激

我们如何完成 从 2d 平面自动感知出 一个 3d 空间呢?是通过两种刺激。

  1. 末梢刺激
  2. 邻近刺激

我们感知到2d图像(物体投影到我们的视网膜),是 邻近刺激,能从2d图像 感知到3d 世界,是叫做 末梢刺激

在这里插入图片描述

另外多说一句,图中 的3,你就可以理解为是 邻近刺激 导致的成像结果。 图中的4 ,你就可以理解为 末梢刺激成像的结果。

那么,我们的视觉系统是如何处理反射到我们视网膜上的物体呢,一个看起来小小的物体投影,它其实是离我们很近的小玩意,还是离我们很远的大东西呢?

都有可能对吧?

举个例子给你,比如,咱们的视网膜上,有这么一个成像结果:

在这里插入图片描述

它到底是啥玩意呢?一个离天天眼睛很近的小铁条?一根稍微远点的筷子?一个晾衣杆?一个被小混混扔过来打他的木棍?还有可能是奥特曼来地球进行撑高跳?
在这里插入图片描述

到底是什么呢?天天百思不解;不仅如此,跟天天反目成仇的好朋友,使用了高级忍术:风遁·障眼法

法术的图标如下:

在这里插入图片描述

天天以为他看到的就是真实,4个物体,绿色三角形,红色圆形,蓝色正方形,黄色长条形。

请添加图片描述

但是反目成仇的好朋友,已经对他进行了降维打击。实际上,这里面有6个物体

请添加图片描述

天天此刻就蒙圈了,到底是4个还是 6 个呢?

现在的情况就是,看到的世界具有解释上的模糊性,因为真实到底有几个物体,你无法确定4,6到底哪一个是真相。

我们的视觉系统也会遇到这样的问题。

投影到我们视网膜的,永远是二维的,你可以用无穷无尽的方式解释这个二维图像。真的是情人眼里出西施。

如果我们的视觉系统要避免这种解释上的模糊性,而是得到一个确定的解释,那么我们就要学会解决 逆向问题 ,逆向问题在视觉系统里面的定义如下:

仅仅使用2d图像,来重建3d世界,也就是通过邻近刺激发生末梢刺激

我们的视觉系统有时候,就是无法解决这个逆向问题,我给你举个例子:

天天之前住在北京,有雾霾,早上他起来看见远处对门的邻居,对方的门那一块,今天看起来怎么那么黑呢?明明这几周看着邻居家的门是白色的啊。看起来是黑色,会不会是因为:

  1. 邻居给门刷漆了?
  2. 邻居今天开门吸雾霾,天天看到的黑色,是邻居他昏暗的屋子里没开灯?
  3. 雾霾结块了,正好结成他家门的形状,挡住了那个区域的阳光吧?

聪明的天天在想到3的时候,又想了想1,立刻转换了思维,他邻居应该不会刷漆,他租的房子,刷了漆,房东要气死;2也不可能,邻居不可能为广大北京市民做这么伟大的事情;所以,真相只有一个

在这里插入图片描述

真相就是:巧了,雾霾挡住了邻居门口的光。

认知的尾声:美女还是老太婆?

在这里插入图片描述

看这个图(学术上叫做Gestalt switches),你会看到一个回头的妙龄女生,还是一个低头的沧桑老阿婆呢?

至此,我们的视觉系统到了一个更加高深的步骤了:我们人类的认知,到底是如何形成的?

我们能透过认知这个步骤,来了解人类如何完成认知的吗?

来,我们一起在讨论区认知一下这个步骤。

参考

https://mind.ilstu.edu/curriculum/vision_science_intro/vision_science_intro.html

end

在这里插入wx图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值