彩色成像的基础和应用 原理 Principles(四)人类视觉 修订版

由于此书覆盖的领域之巨大, 翻译此书是非常具有挑战性的工作,如有过错请谅解和指正。

【注:彩色成像的基础(二)讨论光的传播 (三)光与物质的相互作用 暂时未翻译完成】
        
        前面几章讨论了光及其与物质的相互作用。当光线进入人眼时,会发生一种特别重要的相互作用。光落在视网膜上,会引发一连串最引人注目的事件。在本章和下一章中,我们将根据目前的知识水平,重点讨论这一系列事件。需要注意的是,色彩的神经基础仍是一个活跃的研究领域,因此关于人脑中更高层次色彩处理的知识仍然相对匮乏[496]。此外,我们对视觉皮层的功能组织了解得越多,人类视觉系统就越复杂。尽管如此,我们仍然认为这一主题是理解和有效使用色彩理论所必需的另一半基本背景信息。
【 [496] 《Eye, Brain and Vision》 由著名的医学家 David H. Hubel 所著作】
       
         在本章中,我们主要讨论构成人类视觉系统的基质:眼睛、视网膜 和 大脑神经回路。本章收集的大部分信息来自对旧世界猴子的研究[227,1032]。研究表明,它们的光感受器具有与人类光感受器相同的光谱调谐能力 [78, 1009, 1010],视网膜布局也与人类布局相似 [972]。此外,在猕猴视觉系统中发现的细胞类型和回路与人类视网膜中的细胞类型和回路非常相似 [224-226,604,606,608,892]。
       
                【 这些术语可查看维基百科 或  百度百科 】
                    解剖学和组织学都使用相对于人体方向的术语和结构描述。图 4.1 显示了用于描述结构位置的参照平面。这些平面是[329]:
                midsagittal plane[注释 ],将头部分为左右两半。物体 较近的物体称为medial(内侧),较远的物体称为 lateral(外侧)。
                  [ 正中矢状面: 解剖学术语。在矢状面中,把通过人体正中线的矢状面称为正中矢状平面]

                coronal plane [注释 ] , 将头部分为前部和后部。
                  [矢状面 :解剖学术语。将人体分切为左右两部分,左右切面就是矢状面,而左右相等的切面被称为 正中矢状面。]

                horizontal plane [注释],将头部分为上部和下部。这些 这些区域也被称为头颅和尾部。
                  [水平面 :  又称横断面(transverse plane),与垂直轴垂直,将人体分为上,下两部分的断面。]

                另一个参考术语是 deep [注释],表示与身体表面的距离。
                  [ 深:在解剖学中 ,浅 superficial 和深 deep :靠近体表的部分叫浅,相对深入潜居于内部的部分叫深。]



4.1 颅骨的骨骼结构
    头骨由上半部分(称为颅骨或神经颅骨)和下半部分(称为面部骨骼或视觉颅骨)组成。下部称为面部骨骼或内颅骨。颅骨本身由 颅顶和颅底。
    颅骨包含四个腔,每个腔都有不同的功能:

  1. 颅腔:容纳大脑。
  2. 鼻腔:用于呼吸和嗅觉。
  3. 眼眶:容纳眼睛。
  4. 口腔:构成胃肠道的起始部分。

两个眼眶位于颅骨和面部骨骼之间,由鼻腔分隔。它们作为眼睛和附属器官的眼眶,传输供应眼睛周围面部的神经和血管。

眼眶的形状大致是四边形金字塔,顶端形成视神经管(为视神经和眼动脉提供通道,连接眼眶和颅骨)。它们的墙壁大致是三角形的,除了内侧墙壁是椭圆形的。内侧墙壁平行于矢状面,而外侧墙壁与此平面呈45度角。眼眶的高度、宽度和深度约为40毫米,体积约为30毫升。

4.2 眼的解剖

眼睛用于光感受和将产生的动作电位传递到大脑。水平截面图 4.2 显示了眼睛的结构。眼睛位于眼眶的前部,靠近外侧墙而不是内侧墙,靠近眼眶的顶部而不是底部。
 

眼睛的形状大致是两个相交的球体,较小的形成角膜,较大的形成巩膜。角膜的半径为7.8毫米,约占眼睛周长的六分之一。巩膜占据其余的周长,形成半径为11.5毫米的球体。眼球的轴向长度平均为24毫米。

眼睛有三层结构:外部角膜巩膜包络、脉络膜系和内部神经层。巩膜和角膜共同形成角膜巩膜外壳,提供坚固的外壳支撑和保护内层以及眼睛的内容物。外眼肌连接到这一层以调节眼睛运动。脉络膜系由虹膜、睫状体和脉络膜组成,包含两个开口:前部为瞳孔,后部为视神经管。最内层是视网膜,位于眼睛的成像平面上。它有两层,内层神经感觉视网膜和视网膜色素上皮。视网膜的详细描述在4.3节中。

这三层的透明内容物是房水、晶状体和玻璃体。光线通过这些部分以及角膜后到达视网膜。接下来,我们描述参与将图像投射到视网膜上的眼睛组成部分。

4.2.1 Eye Movements 眼球运动

眼睛在眼眶中移动的能力对两个原因至关重要。首先,中央窝中的视觉敏锐度最高。因此,需要眼睛移动以使感兴趣的特征投射到中央窝上。这种眼睛运动称为凝视转移。其次,人类视觉系统应该能够跟踪静止和移动的物体,即使观察者的头部本身也在移动。

眼睛在所有方向大约能移动45度,尽管在实践中,眼睛很少移动超过20度。更远处的物体通过眼睛和头部的组合运动来跟踪[166]。如果两只眼睛的光学轴之间的角度由于眼睛运动而不改变,我们称之为同向眼球运动。如果两只眼睛的光学轴之间的角度改变,眼睛运动称为异向眼球运动。

【注】同向眼球运动(version movement):即对双眼运动方向一致的一对肌肉(配偶肌)进行比较,以判断一组配偶肌在各方向运动协调情况。三、斜视检查
【注】异向眼球运动(vergence movement):包括集合,分开,垂直。集合的目的是为了矫正外斜视,而分开是为了矫正内斜视,以保持双眼单视状态。 三、斜视检查

同向眼球运动涉及将视野的不同部分投射到中央窝上。这些运动称为(saccades)扫视,非常快,持续约100毫秒。在此期间,角速度可达700度/秒[969]。在这些运动过程中,正常视觉大部分被抑制。

异向眼球运动通常较慢,最大速度为200度/秒。异向眼球运动的主要刺激是在中央窝上的不同投影位置(称为视差)。

在注视过程中,观察者的眼睛并不完全静止,而是有非常小的运动。这种微小眼动包括漂移( drift)、颤动( tremor) 和微扫视(microsaccades)[166]。对于给定的注视点,由于微扫视(microsaccades)而偏离注视点的概率可以建模为角度Θ的以下函数 图4.3[75]。

                                                                                                   



                            



这些微视运动对于正常视觉非常重要。如果它们被人为抑制,视觉图像可能会崩溃或完全消失。

4.2.2 The Cornea 角膜 

角膜在垂直方向上的直径为10.6毫米,水平方向上为11.7毫米,虽然从后面看其周长是圆形的。中央直径为7.8毫米,其余部分的角膜曲率较小。其厚度从中心的0.52毫米变化到周边的0.67毫米。

角膜(n = 1.376)及其相关的泪膜的折射率负责眼睛中大部分光线的聚焦。这个折射率随年龄变化很小。

角膜由五层组成:角膜上皮、前界限膜(鲍曼层)、角膜基质、后界限膜(Descemet膜)和角膜内皮。这些层都是透明的,诸如细胞内外结构的规律性、上皮的平滑度及其无血管等因素有助于其透明度。

角膜由与光波长相比较大的纤维素组成。这是通过测量纤维素的双折射性[236,755]来确定的,这表明角膜中的散射应该导致一种高度不透明的材料。然而,这些纤维素在形状上是均匀的,并且排列成平行行。因此,散射的光被抵消了,留下未被散射的光线,这些光线不受阻碍地通过角膜[755]。

出于医学目的,一些工作集中在角膜建模上[70,418]。

4.2.3 The Iris 虹膜

虹膜悬挂在冠状面前,位于晶状体前面,被充满前后房的房水所包围。虹膜的自由边缘被称为瞳孔边缘。

虹膜的周长为37毫米,直径为12毫米。其瞳孔边缘位于根部更前方。瞳孔的直径在1到8毫米之间变化,这取决于虹膜中存在的两种肌肉的收缩状态:瞳孔括约肌和瞳孔扩张肌。虹膜的前表面有一个厚厚的环状结构,称为领边,它将虹膜分为内部的瞳孔区和外部的睫状区。

虹膜有四层:前边界层、基质、瞳孔扩张器和后色素上皮。前边界层中有间隙,允许在收缩和扩张期间,房水在前房和基质之间流动。这些间隙被称为隐窝。也出现了大量的黑色素细胞团块,这些被称为痣。基质也包含色素,但它也是散射的主要来源,导致人类眼睛颜色的多样性。负责瞳孔收缩的括约肌在这层中自由存在。瞳孔扩张器构成了第三层,并且调节瞳孔的扩张。第四层是总是高度色素沉着且呈现为黑色的后色素上皮。

不同层、隐窝、痣、肌肉以及其他的褶皱、沟壑和放射状条纹形成了复杂的图案,每个人都是独一无二的。人工重现这样的图案,例如用于制作眼球假体,需要艺术与科学的巧妙结合。制作者通常会为虹膜按钮涂上三十到七十层的颜料,交替使用清漆来增加深度(图4.4)。Lefohn等人采用了一种非真实感渲染方法,这种方法受到了制作者工作的启发(图4.5)[667]。最后,每个虹膜的独特性使它们适用于身份识别[234]。
 

 
4.2.4  The Pupil 瞳孔


瞳孔控制进入眼睛的光线量。其大小可以以4赫兹[699]的速率调整,并且取决于周围光照的量,如图4.6所示。还有许多其他因素影响瞳孔直径,包括年龄、调节、药物和情绪[166]。瞳孔收缩的范围最多可以将视网膜照明减少七倍(0.82对数单位[118])到十倍[1262]。



4.2.5 The Lens 晶状体
 

人的眼睛是一个复杂的光学系统,其中晶状体起着至关重要的作用。晶状体位于虹膜和瞳孔的后方,与房水和玻璃体之间悬挂,并连接到晶状体脉络膜(悬韧带),后者又连接到睫状体。睫状体含有睫状肌,它与晶状体本身的弹性一起能够改变晶状体的折射力,这个过程称为调节。这个过程使得眼睛能够聚焦于近处和远处的物体。随着年龄的增长,眼睛的调节能力会减弱,这就是为什么许多老年人需要佩戴阅读眼镜的原因。

晶状体的透明度由其形状、内部结构和生物化学介导。它从房水和玻璃体中获得营养,因此晶状体可以无血管。晶状体前表面的曲率半径约为8到14毫米,而后表面的曲率半径在4.5到7.5毫米之间。晶状体直径约为10毫米,轴向长度为4毫米,尽管晶状体的增长速率为每年0.0023毫米。

晶状体由三层构成:囊、晶状体上皮和晶状体纤维。囊包裹着晶状体,具有弹性,在睫状肌的张力下使晶状体呈更圆的形状。

 
晶状体的曲率在水平和垂直方向上不同,导致散光(水平和垂直线具有不同的焦距)的现象。散光的一个后果是,在视网膜上,水平边缘将始终显示有色边缘,即色差,而垂直边缘将显示不同颜色的边缘。人眼中的色差量以屈光度为单位进行测量,即焦距的倒数。这种效应被认为是通过后续的神经机制以及可能也通过光感受器的密集排列导致的波导作用来纠正的。

除了调节,晶状体的另一个功能是防止光学辐射在295到400纳米之间到达视网膜。这种过滤是为了保护视网膜免受紫外(UV)辐射的损伤。随着年龄增长,晶状体会变黄并且变得更加不透明,从而增加UV过滤的量。变黄是由于光化学反应而不是生物老化引起的,它导致了随着年龄变化的颜色感知。光透过率的降低部分是由于晶状体晶体的规则排列受到干扰,进而引起了增加的散射,从而产生了更加不透明的晶状体。这被称为白内障。

最后,晶状体是荧光的来源,在入射的紫外线辐射被吸收后会重新发射到可见光范围内。这种现象随着年龄增长而增加。对于一个30岁的健康晶状体来说,入射(天空)光与产生的荧光量之间的比率约为0.002。随着年龄的增长,这个比率增加到约为0.017(可注意到)的60岁和0.121的80岁。在这些比率下,荧光的出现被视为遮光。

根据入射紫外线光的波长,荧光的范围和峰值波长会有所变化。例如,入射波长为360纳米的光会产生范围在380纳米到500纳米以上,峰值波长为440纳米的荧光。波长为360纳米的光是晶状体的吸收峰值附近。

在老化的晶状体中,紫外吸收带还会向蓝色方向扩展,这表明利用阻止紫外线和可见光短波长的滤光片可能有助于改善人类视觉。这将减少遮光和荧光 [657, 1297]。
 

4.2.6 The Ocular Media

眼睛的介质除了参与调节外,睫状体还负责产生房水,这是填满前后房的液体。睫状体分泌的液体首先进入后房,后房通过瞳孔与前房相通。流向小梁网和Schlemm氏管(图4.2)。房水的补充速率为每分钟4微升。前房容纳约250微升的液体。

房水的功能包括滋养角膜和晶状体、排出有毒的代谢废物,以及维持对角膜和晶状体的压力。后者通过平衡液体的产生和排出来实现,对眼睛的正常功能至关重要。

玻璃体腔约占眼球体积的三分之二。其中的内容称为玻璃体或玻璃体,重量为3.9克。它由折射率为1.337的透明粘弹性凝胶组成,主要是无细胞的。
 

因此,视网膜上的图像形成是由角膜、房水、晶状体和玻璃体介质介导的。它们的折射率分别列在表4.1中。它们共同将光聚焦在视网膜上。然而,眼的介质并非完美的透射体,会因菲涅耳反射、吸收和散射而产生光损失。菲涅耳反射通常不超过3到4%。光学系统通常被优化用于开放空气中。例如,在水下环境中,从水到角膜的折射率不同,导致视觉模糊。

此外,眼的介质的折射率取决于波长,导致投射到视网膜上的边缘显示彩色边缘,称为色散。

最初的折射表面是最强的。眼睛的介质中发生的像差在年轻人中只略微随年龄增加,并且在很大程度上由后续的眼部表面进行校正。然而,眼的介质中后期的折射边界的矫正能力随年龄增长而减弱,因此视网膜上的总像差随年龄增加而增加。例如,晶状体的持续生长会导致晶状体的像差随年龄增加而增加。

短波长的吸收发生在角膜。这可能会破坏表面组织,导致光角膜炎。最低的损伤阈值(0.4 J/cm2)为270纳米的光。进一步的短波长吸收发生在晶状体中心。这种吸收会随着年龄的增长而增加。最后,在视锥体外段前面有一层黄色色素(叶黄素),它吸收短波长的光。人眼的平均透过率见图4.8。
 

眼中会发生一些光的散射。这意味着如果眼睛暴露在点光源下,将照亮视网膜的一个小区域,而不是一个单一的点。眼中的光散射也被称为遮光。径向角度的强度衰减可以通过点扩散函数p(Θ)来建模。
 



这个函数在图4.9中绘制出来,根据Baxter等人的研究[75],它由收集的视角小于5角分的数据[615]和大于9角分的数据[336, 402, 1185]叠加而成。
 

4.2.7 The Retina and the Retinal Pigment Epithelium 视网膜及视网膜色素上皮

视网膜(神经视网膜)是一种神经感受层,能够将光转化为信号并将这些信号传输到大脑。它主要是一个松散的层,只在其前端和视神经头的边缘附着[329]。视网膜的表面积为1250平方毫米,厚度在100微米到230微米之间变化。

视网膜包括多个区域,如图4.10所示。尽管临床医生和解剖学家使用不同的术语,但在这里我们将使用解剖学术语:
 

  • 中央区(area centralis)为圆形,直径为5到6毫米。它位于上颞动脉和下颞动脉之间。
  • 黄斑(fovea)直径为1.5毫米,位于视盘外侧3毫米处。它含有一层黄绿色素,使其呈现黄色(因此临床术语称为黄斑)。
  • 黄斑中心凹(foveola)为0.35毫米直径的区域,由一个凹陷及其周围的边缘组成。该区域无血管。视网膜的视觉敏锐度(分辨能力)在此区域最高。
  • 视盘(optic disk)没有视网膜层或感光细胞。它被称为盲点。它位于黄斑中心的内侧3毫米处。
  • 外周视网膜(peripheral retina)是视网膜的其余部分。 

神经感官视网膜的组织学将在第4.3节进一步讨论。

视网膜的背面由视网膜色素上皮支撑,它为视网膜提供附着力和营养。它还含有大量的黑色素,有助于吸收光线。这减少了眼中的光散射,从而提高了图像分辨率。

视网膜的一个特殊性是其BRDF(双向反射分布函数)不是兰伯特型,这意味着它的光吸收能力依赖于入射方向。由于视网膜相对于瞳孔的位置,光线到达视网膜外周时会以角度入射,在这种情况下光的吸收效率低于视网膜中心。

因此,光线通过瞳孔中心进入并到达视网膜上的特定位置时,会比从瞳孔接近瞳孔边缘的地方经过后到达相同位置的光线更容易被吸收。这被称为第一类斯泰尔斯-克劳福德效应 [167, 789, 1088]。

同时,吸收显示出随入射角变化的波长依赖性,导致视网膜位置的偏心性引起颜色变化。这被称为第二类斯泰尔斯-克劳福德效应 [34, 1089, 1262]。这一效应的解释之一是,入射到视网膜的光线在被吸收之前经过了更长的距离,因此发生了更多的衰减,从而解释了入射角度对颜色的影响 [85]。此外,来自脉络膜的回散射也可能对这一效应有一定贡献 [85]。

波导效应也涉及到斯泰尔斯-克劳福德效应的解释 [40, 1183]。感光细胞的尺寸及其密集的排列产生了类似光纤的效果(有关波导效应的更多内容见第4.7节),创建了方向灵敏性。波导效应似乎减少了眼睛光学介质中的像差 [1183]。

4.3 The Retina 视网膜

当光线进入眼睛时,它会通过眼部介质,然后通过多个细胞层,最后被感光细胞吸收。感光细胞位于视网膜的最深处 [803],与提供视网膜(维生素A)的视网膜色素上皮紧密接触。这种分子在光转导中至关重要。

 


视网膜前面的细胞层厚度各异,特别是在黄斑中,光线在到达感光细胞之前需要穿过更薄的层,如图4.11所示。视网膜厚度变化的图示见图4.12。

 

神经感官视网膜层将光转化为神经信号,然后传输到大脑进行进一步处理。为此,视网膜由几种类型的细胞组成,包括感光细胞、双极细胞、神经节细胞、无突触细胞和半细胞 [262]。在每个类别中,根据形态或响应类型可以进一步细分。根据物种的不同,水平细胞有1到4种类型,双极细胞有11种类型,无突触细胞有22到40种类型,神经节细胞约有20种类型 [227, 609, 723, 749, 1177, 1217]。虽然主要的细胞类型都参与了视觉信号的神经处理,但视网膜还包含胶质细胞、血管内皮、周细胞和小胶质细胞。

感光细胞、双极细胞和神经节细胞提供了垂直连接 [915],而水平细胞和无突触细胞则提供了横向连接。视网膜神经细胞的细胞连接示意图见图4.13。这些细胞被组织成三个细胞层,在图中以蓝色背景标示,并有两个突触层,细胞在这些层中连接。这些层被称为内层和外层网状层 [262]。视网膜中发生的每种细胞类型将在以下章节中详细讨论。视觉处理通常从外层传播到内层视网膜 [935]。

涉及向大脑传递信号的细胞可以被特定大小、形状、颜色或运动的光模式刺激。能够最优刺激给定细胞的光模式被称为该细胞的感受野 [430]。例如,感光细胞直接响应其上的光线。它们的感受野非常狭窄。视觉路径中的其他细胞则具有更复杂的感受野。

4.3.1 Photoreceptors 感光细胞

感光细胞有两种类型,分别是杆状细胞和锥状细胞 [1015]。杆状细胞在低光条件下活跃,介导对对比度、亮度和运动的感知。这种光照条件被称为暗视觉(scotopic)。锥状细胞在明亮的光线(光视觉水平)下工作,介导颜色视觉。暗视觉和光视觉的光照条件部分重叠。杆状细胞和锥状细胞都活跃的光照范围被称为中等光照范围(mesopic range)。

视网膜中约有1.15亿个杆状细胞和650万个锥状细胞。杆状细胞和锥状细胞在视网膜上的密度各异。外周视网膜主要由杆状细胞组成,密度约为每平方毫米3万个。锥状细胞的密度在黄斑中最高,约为每平方毫米15万个。在黄斑中没有杆状细胞 [1015]。视网膜上杆状细胞和锥状细胞的密度图示见图4.14。
 

杆状细胞和锥状细胞构成了一个处理阶段的序列,称为通路。通路是相互连接的细胞序列。例如,感光细胞连接到双极细胞以及半细胞。双极细胞也通过一层无突触细胞相互连接,然后连接到神经节细胞。神经节细胞则将信号从眼睛传送到大脑的外侧膝状体(LGN),该小区域与视觉皮层相连。

视觉通路中每个阶段的互连非常复杂且多样。除了前向处理,所有阶段和神经层都具有反馈回路。大脑也对视网膜有反馈 [347, 482]。

对视网膜中发生的视觉处理的完全理解仍超出了我们的能力。然而,关于视网膜的了解比对大脑中其他处理中心的了解要多。在本章其余部分,我们将简要概述一些已知的人类视觉系统的特殊性,因为这是人类(颜色)视觉的基础。

4.3.2 Rods 杆状细胞

在有利的情况下,人类视觉系统可以检测到单个光子 [446, 1018, 1205],这归因于杆状细胞的敏感性和杆状细胞通路中的光子积累。杆状细胞在距离黄斑中心5毫米的环状区域内密度最高 [862](见图4.14)。杆状细胞呈六边形排列,彼此分隔开来。
 


关于杆状细胞和锥状细胞中光转导的分子步骤已有大量研究 [289, 928]。这里提供一个简化的概述。杆状细胞含有一种叫做视紫红质(rhodopsin)的视觉色素,其峰值光谱敏感度为λ_max = 496 nm(见图4.15)。每当一个视紫红质分子吸收一个光子时,会发生一种化学反应,使分子褪色,进入一种无法再吸收光子的状态。这会降低杆状细胞的敏感度。经过一段时间,这一过程会逆转,视紫红质会再生。


再生过程相对较慢,虽然比暗适应过程要快。暗适应可以通过心理物理学方法测量,即在进入黑暗房间后恢复敏感性的时间。尽管暗适应可能需要至少30分钟,但视紫红质的再生则需大约5分钟。有关暗适应持续时间的一些原因见第3.4.2节。

再生速率与视紫红质的数量有关。如果 p ∈ [0,1] 是未褪色视紫红质的比例,d p/dt 的变化率可以用以下公式描述 [118]:
 

 
该微分方程的解为:

 
这一行为确实被观察到 [987]。褪色过程遵循类似的变化率 [118]:
 

 
其中,L_v 是造成褪色的光强度,L_0 是每秒褪色1/400视紫红质的光强度。这个微分方程的解为:
 

 
褪色和再生的联合效果由以下公式给出:
 



由于褪色和再生同时发生,持续暴露于恒定的光量下会使视紫红质的数量趋于稳态。一旦达到稳态,变化率必然为零。因此,(4.7)给出了未褪色视紫红质比例 p 和稳态照明 L_v 之间的关系:
 



L_0 的值被称为半褪色常数。该方程显示,对于非常小的 L_v 远小于 L_0,L_v 与 p 之间的关系几乎是线性的。对于非常大的 L_v,未褪色视紫红质的比例渐近接近零。围绕 L_0 处,p 在 0.01 和 0.99 之间的光强度范围约为2个对数单位(即,L_p=0.01/L_p=0.99 ≈ 100)。
 

4.3.3 Cones 锥状细胞

在锥状细胞中,视紫红质的褪色和再生过程也发生在与锥状细胞相关的视色素(opsins)中。光强度 L_v 作为 opsins 的变化速率由以下公式给出 [118]:



 

由于只有常数120与(4.7)不同,opsins 的稳态行为与视紫红质相同,给出的方程为(4.8)。

锥状细胞有三种类型,它们对不同波长的光具有峰值敏感度。这三种类型可以大致分类为对长、中、短波长敏感(分别简称为 L、M 和 S 锥状细胞),如图4.16所示。其峰值敏感度 λ_max 分别在 440 nm、545 nm 和 565 nm 处 [1036]。有三种不同的锥状细胞类型,人类的颜色视觉被称为三色视觉。
 

图4.16还显示了每种锥状细胞类型对广泛波长范围的敏感度,尽管相对比例不同。感光细胞产生的信号因此与作用于接收器上的波长混合成正比,由接收器的敏感度曲线加权。因此,单个锥状细胞不能区分颜色。颜色的感知来自于不同锥状色素产生的信号在处理管道中的比较。

锥状细胞的输出是所有入射波长的加权和,敏感度曲线如图4.16所示为加权函数。这导致了同质化现象,即两种不同波长分布的光被感知为相同的颜色。如果光谱导致三种不同光敏色素的吸收三重值相同,则不同光谱的光可能会引发相同的颜色感知。如果光谱导致不同的吸收,光通常会被感知为不同的颜色。

 
除了峰值敏感度的波长,锥状色素的吸收光谱形状也值得一提 [643, 644, 732]。已发现,如果将光谱曲线绘制在对数-线性尺度上,曲线的形状会变得相同,即将对数敏感度对波长进行归一化,λ_max/λ(见图4.17) [644]。

通过曲线拟合程序,得到以下表达式,该模型描述了锥状色素的光谱敏感度 S 作为 λ_max/λ 的函数:

在线性尺度上,以上提到的三种峰值敏感度的曲线见图4.18。这些曲线与图4.16中的测量数据一致 [1092]。它们也与通过对人类、猴子、松鼠视网膜中的单个感光细胞的心理物理实验和电生理实验获得的数据相匹配 [644]。
 



 

当受到刺激时,感光细胞产生一个渐变电位,进而触发后续细胞层(双极细胞和无突触细胞)的响应。输出的动态范围有限,如所有神经元 [355],可以用改进的米氏-门登(Michaelis-Menten)函数 VMM 或指数函数 Vexp 来建模:


 

其中,L_v 是光度(光度加权辐射度,见第6章),j 是最大光电流,σ 是半饱和常数,n 是通常略小于1的指数 [77, 483, 1169]。特别地,Boynton 和 Whitten 估计指数为0.7 [117]。

半饱和常数决定了将哪一值的 L_v 映射到最大输出的一半。因此,感光细胞的输出被建模为在小值下线性,并在大值下渐近地达到最大输出 j。然而,感光细胞,特别是锥状细胞,能够调整其增益,即 σ [355]。

公式(4.11)在假设瞳孔固定且没有褪色的情况下建模了锥状细胞响应的非线性。考虑到这些影响,锥状细胞的响应可以用以下公式建模 [118]:

其中,p 是根据(4.8)得出的未褪色 opsins 的比例,A 是相对瞳孔面积,作为 L_v 的函数见表4.2。该方程适用于 L_v 保持恒定的稳态情况。

一个最近的、更完整的锥状细胞响应计算模型,包括光转导、钙反馈和锥状细胞内段的转导,由 van Hateren 描述(见第4.8节) [434]。

4.3.4 The Photoreceptor Mosaic (光感受器马赛克 注:中文没有对应的翻译 翻译可能不正确)


与L和M锥体相比,S锥体相对稀疏,且在中央凹中更为稀疏。在直径为100微米(0.34度)的中央视网膜盘(中央凹小窝)中,它们是缺失的[220]。这意味着即使是具有正常色觉的人,在面对小而短暂的目标时,中央凹也会表现出三色盲(S锥体功能丧失)[610, 1248]。

由于L和M锥体的峰值响应仅相差30纳米,它们在光谱敏感性上有很大的重叠,从而在亮度信号中几乎平均贡献。而S锥体的峰值敏感性则非常不同,因此在亮度信号中表现较差[861]。因此,中央凹的中央部分似乎更倾向于保持高空间敏锐度,而不是高对比度的色觉[352]。

然而,S锥体在中央凹缺失的另一种解释是可能的。例如,可以认为,中央凹中S锥体的缺失有助于抵消眼内介质中的瑞利散射效应[1036]。

在周边区域,S锥体以非随机的顺序按规律间距排列[1245]。而L和M锥体的排列本质上是随机的。视网膜中锥体排列的示意图见图4.19。

 
人类视网膜中不同类型锥体的比例在个体之间差异很大[785, 977]。例如,测得的L和M锥体比例在一个人身上是3.79:1,而在另一个人身上则是1.15:1 [1245]。这种差异对色觉的影响很小[121, 911],这可能是由于多种因素的结合。首先,自然场景的统计特性使得高频、高对比度的信号很少见。此外,眼内介质中的散射可能有助于防止混叠。最后,感受器后的处理可能会补偿光感受器马赛克的特殊性 [824]。尽管如此,在健康个体之间,光照条件下的光谱敏感性仍然存在一些差异,主要归因于L和M锥体的随机排列以及这些锥体类型之间比例的差异[227, 670]。

L和M锥体与S锥体的总比例约为100:1[1205]。如果我们假设L/M比例为2:1,那么三种锥体类型的比例为L:M:S = 0.66 : 0.33 : 0.01

最后,中央凹中锥体的密度在个体之间有显著差异。测量显示,中央凹中的锥体密度可以从每平方毫米98,200个锥体到大约每平方毫米324,100个锥体不等[219]。在中央凹外,感受器密度的差异要小得多。可以认为,中央凹外的锥体密度仅仅足够保持每个锥体的光子通量恒定,因为随着偏心度的增加,视网膜的照明会逐渐减少。在偏心度φ=1°和φ=20°之间,锥体密度d(φ)可以通过以下方式建模[1157]:
 

 
最后,锥体密度在水平子午线和鼻侧略高一些[219]。
 

4.3.5 Bipolar Cells 双极细胞


双极细胞主要接受来自光感受器的输入。根据它们对来自光感受器的神经递质谷氨酸的反应,它们被分为不同的类型。例如,它们可能对视觉信号的快波动或慢波动调节得更敏感[609]。双极细胞(以及大脑中所有其他细胞)的神经化学性质决定了它们的功能[457]。一些双极细胞激活ON路径,即检测黑暗背景下的光线。其他双极细胞则响应于光亮背景下的黑暗斑点,并启动OFF路径。ON双极细胞和OFF双极细胞并行工作,并可能从同一锥体中获取输入。ON和OFF信号的并行处理在视觉路径的后续部分继续进行;双极ON和OFF细胞连接到单独的ON和OFF神经节细胞。

具有单独ON和OFF路径意味着光和暗的感觉是由不同的过程介导的。基于心理物理实验,这一观点在一个世纪前由赫林[461]首次提出。

在中央凹中,L和M锥体各自连接到一个单独的小神经节细胞。因此,小神经节细胞携带色彩信息。然而,中央凹还包含连接到不同锥体类型的扩散双极细胞,因此携带的是非色彩信息[1217]。扩散双极细胞具有中心-周围组织结构[223](见第4.3.6节)。

S锥体形成一条独立的ON路径。连接到蓝锥体的独立蓝锥体双极细胞已被识别[612],它们介导S锥体的ON路径。此外,每个S锥体连接到一个小神经节细胞[597, 598],这可能构成蓝色OFF信号的基础[227]。
 

4.3.6 Horizontal Cells 水平细胞
 

除了接受来自光感受器的输入,双极细胞还通过水平细胞在横向上相互连接。这些细胞具有非常宽的感受野,即它们与大量的双极细胞和光感受器相连接。同时,水平细胞的质膜相互连接,从而进一步扩大它们的感受野。

水平细胞连接到其树突域(即感受野)内的所有锥体。这意味着,在水平细胞的感受野内可能存在不同类型的锥体,因此水平细胞不一定具有色彩选择性[1217]。然而,已发现两种主要的水平细胞类型,H1和H2,前者优先(但不排他性地)接受L和M锥体的输入,而后者优先连接到S锥体[223]。

水平细胞通过直接连接或通过涉及光感受器的反馈机制向双极细胞提供抑制性对手信号[609]。如果双极细胞感受野周围的区域与双极细胞感受野本身不同,则由于水平细胞的作用,信号会进一步增强。因此,双极细胞的感受野会受到相邻光感受器和双极细胞活动的间接影响。由于双极细胞与光感受器的连接,对光的反应称为中心,而由于水平细胞活动导致的更广泛感受野的调制称为周围。通常,ON双极细胞会通过OFF周围增强,而OFF双极细胞则通过ON周围增强——因此被称为对手信号。

水平细胞的活动,进而间接影响光感受器和双极细胞的活动,受到来自内丛状层信号的进一步反馈的调节。这使得光感受器能够对光线进行神经适应,此外还有第4.3.3节中概述的非线性反应机制。这种反馈机制还为双极细胞的颜色编码反应提供了可能性[609]。因此,认为视网膜信号的处理是严格前馈的观点是错误的,因为即使是光感受器也会从后续处理阶段接收反馈。
 

4.3.7 Ganglion Cells 神经节细胞


神经节细胞在视网膜和大脑之间形成连接。它们从双极细胞和无长突细胞接收输入,通过其轴突(形成视神经束)将信息传递到外侧膝状体。

人类视网膜中主要的神经节细胞类型是ON中心和OFF中心[430]。当光斑落在其感受野的中心时,ON中心神经节细胞被激活。相反,当光落在其感受野的外围时,神经节细胞的激活模式反转,并在外围受到光照时激活;中心受到光照时抑制。因此,这些神经节类型的感受野是同心的,具有中心-周围组织结构(ON中心,OFF周围,反之亦然)[632]。

在中央凹中,神经节细胞的感受野比视网膜的其他部分要小得多。在这里,小神经节细胞与小双极细胞一一对应。中央凹中的每个红锥体和绿锥体(但不是蓝锥体)连接到一个ON和一个OFF小双极细胞,而这些双极细胞又分别连接到一个ON和一个OFF神经节细胞,从而继续ON和OFF路径。这使得中央凹中的锥体能够以非常高的空间分辨率传递暗-亮和亮-暗信息[609]。

神经节细胞对彩色刺激有两种响应方式:非色彩的或色彩对手的。特定的神经节细胞类型,伞状神经节细胞,是携带非色彩信息的基础,即L和M通道的总和信息。

经典的颜色对手模式出现在神经节细胞受到长波长光(红色)刺激并受到短波长光(绿色)抑制时[1190]。这种红/绿颜色对手性与存在绿色/红色颜色对手性神经节细胞类型相互平衡[223]。然而,这种颜色对手性只出现在中央凹,那里中心的大小被缩小到单一的锥体类型。在周边区域,随着偏心度的增加,感受野的大小逐渐增加,这里的小神经节细胞接收来自L-和M-锥体的中心和周围输入。这与心理物理学证据一致,即红/绿敏感性随偏心度的增加而下降[223, 801]。

双分层神经节细胞形成另一种类型的细胞,携带蓝-ON/黄-OFF信号[221]。它们在空间上不是对手的,因为它们的中心和周围区域几乎相同。ON信号来自S-锥体(通过蓝锥体双极细胞),而周围信号则来自L-和M-锥体(通过扩散双极细胞)。因此,双分层神经节细胞携带的是S-(L+M)信号。视网膜中还存在几种具有复杂感受野的其他神经节细胞类型,例如,选择性响应方向和运动的细胞[60, 62]。
 

4.3.8 Ganglion Cell Classifications 神经节细胞分类
 

Gouras[382]进一步对神经节细胞进行了分类,将这些细胞细分为缓和型和相位型,这两种类型对光刺激的响应方式不同。缓和型细胞对光的反应是稳定的。它们的感受野非常小,并且对颜色特异性。这些细胞投射到外侧膝状核的细胞层(见第4.4节),因此是细胞路径的一部分。它们的最佳响应是高对比度信号和高空间分辨率。

缓和型细胞可以有红、绿或蓝色中心(包括ON和OFF),对应于三种锥体类型。它们的周围也是光谱选择性的,虽然来自与中心不同的锥体类型。蓝色OFF中心类型极为罕见[788]。

相位型神经节细胞的感受野较大,对刺激的开始或结束作出短暂反应。对于小光斑,短暂的放电后跟随一个较小的持续放电。大光斑的光线只会产生初始的短暂反应。短暂行为是由于延迟的中心反应而引起的抑制性周围反应所致。

相位型细胞通常是非色彩的,并投射到细胞层的放射层。它们检测亮度变化,但不检测颜色变化[221]。相位型细胞对覆盖较大区域的低对比度信号更为敏感[826]。

还有其他颜色对手性神经节细胞类型。例如,存在具有颜色对手中心但无周围的细胞。这种细胞存在于蓝-黄颜色对手性中[221]。

神经节细胞对空间频率有调节,即它们对空间变化模式的敏感性在特定的空间频率下达到最高。通过引入一个由某种方向上的正弦波组成的光栅到神经节细胞的感受野中,并逐渐降低对比度直到细胞刚好响应,可以推导出可见性的阈值[826]。

通过对不同空间频率的正弦波重复此过程,可以创建一个阈值曲线。这种曲线称为对比度敏感性函数(CSFs),显示在给定频率下的峰值响应[284]。这是神经节细胞对比度最敏感的频率。

除了对比度敏感性峰值,神经节细胞还可以通过其感受野内运动的敏感性(称为超敏性)来表征。最小可检测位移通常远小于预期的中心感受野大小或峰值对比度敏感性[1031]。

对比度敏感性和超敏性测量的一个有用特征是,它们既适用于神经节细胞,也适用于人类心理物理表现。这导致了这样的结论:生物体无法检测到神经节细胞未检测到的视觉刺激[826]。

神经节感受野可以通过两个高斯分布的差异来合理建模。中心由具有较小半径和较大振幅的正高斯函数建模。周围的高斯分布从中心分布中减去。这就是所谓的高斯差异(DoG)模型。
 

4.3.9 Amacrine Cells  无长突细胞


无长突细胞在双极细胞和神经节细胞之间提供横向连接,同时还在ON和OFF视觉路径之间提供纵向连接。此外,通过无长突细胞,杆状体和锥状体路径也相互连接,如第4.3.10节中所述。

存在大量不同类型的无长突细胞,它们似乎参与了适应环境变化的过程。例如,日出和日落期间的日光光谱组成与正午时的光谱组成非常不同。在光照条件变化时为大脑提供最佳信号需要一个光驱动的调节系统,这可能由无长突细胞介导。

举个例子,反馈会提供给水平细胞。例如,当特定的无长突细胞受到闪光光刺激时会释放多巴胺。这种神经递质反过来解耦了水平细胞,从而有效地缩小了它们的感受野[609]。

另一个例子是生长抑素免疫反应性无长突细胞[961, 988],它们的细胞体和树突主要位于视网膜的下半部分。它们的轴突投射到视网膜的上半部分。在正常的观察条件下,来自天空的光主要投射到视网膜的下半部分,而来自地面的反射光则投射到视网膜的上半部分。因此,生长抑素免疫反应性无长突细胞可能参与了对来自视野不同部分的光线变化的适应[1217]。
 

4.3.10 The Rod Visual Pathway 杆状细胞视觉路径


杆状体投射到只有一种类型的双极细胞——杆状双极细胞。大量的杆状体投射到一个杆状双极细胞上。这些双极细胞不直接连接到神经节细胞,而是与无长突细胞突触连接[605, 607],从而分散信号。在杆状视觉路径中存在两种主要的无长突细胞类型,分别命名为AII和A17。

AII无长突细胞将杆状体和锥状体路径连接起来,使得杆状体信号也可以利用锥状体双极细胞到达神经节细胞。此类无长突细胞主要位于杆状双极细胞之后,与神经节细胞突触连接。它们的视野较小,这意味着它们的横向扩展受到限制。然而,AII无长突细胞也直接相互连接,就像水平细胞相互连接一样。这扩大了它们的影响范围。在明亮的光照条件下,当需要保持狭窄视野的锥状体路径的空间分辨率时,另一种类型的无长突细胞释放神经递质,从而解耦AII无长突细胞,缩小其感受野并最大限度地减少杆状体路径的干扰。

另一方面,A17无长突细胞具有广泛的视野,通常从大约1000个双极细胞中接收输入,使其对光线非常敏感。A17不与其他无长突细胞或神经节细胞突触连接。它的巨大感受野似乎用于整合信号,有助于设定敏感度水平[825]。

杆细胞向双极细胞的显著汇聚以及通过无长突细胞的信号分散被认为增加了杆路径的光敏感性。它通过信号的聚合实现了这种极高的敏感性,但以牺牲空间分辨率为代价。

最后,在中光范围内,杆视力对色觉有(相对较小的)影响。

4.4 The Lateral Geniculate Nucleus 外侧膝状体

离开视网膜的信号投射到大脑的几个部分,包括上丘和外侧膝状体。与色觉有关的是通过外侧膝状体(LGN)的路径。这些位于丘脑的两侧,并将信号从眼睛传递到初级视觉皮层。

每只眼睛离开的视神经被分成两部分,鼻侧部分交叉过来(图4.20)。这意味着每个LGN都接收来自两只眼睛的输入。左LGN负责处理每只眼睛的左半部的视觉输入,右LGN处理右视觉场。神经束交叉的地方叫做视交叉。

从视网膜投射到每个LGN并从那里进入皮层的有三条路径。这些路径统称为视网膜-膝状体-皮质通路。每个LGN包含多个层,每一层只接收来自一只眼睛的输入。此外,每一层根据细胞类型分类,并主要接收来自一种神经节细胞类型的输入。因此,在视网膜中分开的信号在LGN中保持分离(图4.21)。已经发现三种类型的层,其中第三种层介导来自蓝锥体的输出,这是相对较新的发现[157, 257, 458].。



 

这三种层类型是[257]:

Magnocellular layers 大细胞层。这些层接收伞状神经节细胞的输入,因此负责传递无色L+M信号[227, 660]。这些细胞具有空间中心-周围配置,其中ON中心细胞在中心接收来自L锥体和M锥体的兴奋性输入,在周围接收抑制性输入。OFF中心细胞具有相反的极性[352]。

Parvocellular layers 小细胞层。接收来自侏儒神经节细胞的输入,这些层负责传递L-M信号,即介导红绿对立色觉[673,891]。Wiesel和Hubel首次提出了一种神经回路的可能性,即感受野的中心受到一种锥体类型的激发,周围则受到另一种锥体类型的激发[1244].。此类组织的证据已得到证实,例如,在红绿对立的神经节细胞[661]和LGN中[746, 946, 947]。然而,需要注意的是,侏儒神经节细胞在旁中心区的树突场尺寸增大,因此它们的中心和周围都接收来自L锥体和M锥体的输入。因此,红绿对立色觉在旁中心区不再保持[222, 223]。

通过比较频谱锥体响应数据[1091]和利用 de Valois 及其同事获得的数据[1172]对该层细胞的测量结果进行的主成分分析[976],可以看出副细胞层没有 S 锥体输入。

Koniocellular layers 灰细胞层。这些层有时也被称为嵌层[322, 406],尽管首选的命名是灰细胞。此类有三对层。最背部的一对将低分辨率信息传递到初级视觉皮层(也称为V1区)[564]。中间的一对将源自双层神经节细胞的信号传递给初级视觉皮层的细胞色素氧化酶斑块,传递蓝黄色S-(L+M)信号[257, 458]。最腹侧的一对与上丘有关。除了这些主要路径外,灰细胞神经元还投射到额外的皮质区域,绕过V1[458, 973, 1052, 1286]。

4.5 The Visual Cortex 视觉皮层


视觉皮层是大脑中处理视觉信号的主要位置。它包含大量独立的功能单元,这些单元通过前馈和反馈连接相互连接。这些皮层区域包括:
 

  • V1。这是接收来自外膝体(LGN)输入的视觉皮层的主要部分。在旧的分类体系中,这一部分也被称为Brodmann 17区[138, 710],同时也被称为初级视觉皮层或纹状皮层。
  • V2。V2区在使用细胞色素氧化酶染色后,显示出细条纹、粗条纹和浅条纹,每条纹分别接收来自V1不同区域的输入。
  • V3。这个区域被认为涉及来自不同路径信号的整合。
  • V4。这个区域被认为在色彩信息的处理中扮演重要角色。 
  • MT。MT 区又称 V5 区或中颞区。该区域的细胞往往对运动非常敏感。它主要接收来自膝状体系统的输入。 

 
还存在许多其他区域,但大多数已知的是V1、V2和MT区 [563]。各个区域之间的主要前馈投射如图 4.22 所示。在多个区域,包括V1、V2、V3,特别是在V4中,都发现了颜色选择性细胞。然而,V4[206,624,705,1113,1289,1290]是否可以被视为颜色处理中心仍然存在争议,因为有些研究表明是不同的组织[282, 407, 1139]。


4.5.1 Area V1 V1区


V1区是外侧膝状体的信号进入视觉皮层的主要入口。它由六层组成,其中一些层进一步分为子层[138, 710]。此外,包括第二层和第三层在内的几层具有被称为斑块或小斑的柱状结构。斑块之间的区域称为斑间或小斑间。斑块和斑间的分离基于一种名为细胞色素氧化酶(CO)的组织化学技术,它根据代谢区分细胞,揭示了初级视觉皮层第二层和第三层的结构。
 

仍需解决的一个挑战是确定位于不同层的细胞的功能。这个问题可以解释为解开功能结构,即确定相邻细胞是否有共享一个或多个感受野特征的趋势[493]。

据信柱状结构与功能结构有关,有几种不同功能的提议,包括眼主导、方向、空间频率和颜色。例如,初级视觉皮层中的许多细胞对方向敏感。这些方向选择性细胞对拉长的而非圆对称的感受野反应最佳,并且是朝特定方向定向的。发现这种选择性在4B层尤为显著,但在其他层中也存在[408, 438, 964]。

长期以来,人们认为从视网膜到初级视觉皮层及其更远处的功能路径存在隔离,分别处理颜色、形态和运动/立体[287, 694]。在这种三分模型中,V1区将三条路径转变,然后投射到V2区[692–694]。

起源于外侧膝状体核的视觉辐射在不同层和第二层与第三层的斑块中突触连接,如图4.23左侧所示。这里可以看到,LGN中的不同层投射到V1区的不同部分。这似乎提供了视网膜起源的不同路径在V1中保持功能隔离的证据。

然而,V1区内的皮层回路,即LGN投射后的V1区内的相互连接,表明这些路径并未保持分离,而是相互结合[148, 636, 1051, 1265, 1281]。图4.23中显示了皮层内连接的摘要。研究进一步证实了这一发现,即方向选择性细胞也可以调谐为颜色选择性细胞[209, 491, 669, 674, 1127, 1181, 1189]。

另一个复杂因素是V1区既有来自大脑中其他功能区域的前馈连接,也有反馈连接[1008]:

  • 来自其他区域到V1的前馈投射起源于:丘脑、LGN、岛盖、旁中央核、缝合系统、蓝斑核和梅恩特氏基底核[6, 104, 260, 384, 459, 635, 844, 889, 957]。

  • 来自其他区域到V1的反馈投射起源于:V2、V3、V4、MT、MST、额叶眼区(FEF)、LIP和颞下皮层[69, 889, 970, 1041, 1108, 1164, 1165]。

  • V1区前向投射到V2、V3、MT、MST和FEF[115, 323, 693, 709, 753, 1041, 1164, 1165]。

  • V1区向后向投射到SC、LGN、丘脑和脑桥[333, 334, 384, 409, 709]。

为了建模V1区的微回路以及理解V1的功能,这些反馈机制可能起到的作用至少与LGN输入同等重要[747]。

尽管在LGN中颜色处理沿着暗-亮、红-绿和黄-蓝轴进行,但在V1区并非如此。LGN投射在V1中以线性和非线性方式重新组合,导致颜色敏感性更尖锐地调谐到特定的颜色范围,而不一定与LGN中的颜色方向一致[209, 419, 1175]。特别是,已经确定了响应紫色的细胞簇[1189]。心理物理学研究确认了LGN到纹状皮层的颜色转换可能性[1174, 1176]。

这些非线性重组可能是人类颜色类别感知的基础。也可能在V1中的独立颜色变换有助于颜色边界和有色区域的感知[1030]。一个提出的三阶段颜色模型,解释了通过神经生理实验和心理物理学测得的现象,在第4.6节讨论。

总之,V1区中的许多细胞对多种刺激作出反应,如颜色、位置、方向和方向。认为颜色、形状等处理路径保持分离的观点可能并不成立。此外,V1区是众多颜色处理区域之一,因此逐步从LGN中的颜色对立机制转变为更符合颜色感知的机制。

4.5.2 Area V2 V2区

V2区在细胞色素氧化酶染色下显示为粗、细和淡条纹。沿这些组织化学定义的区域存在一定程度的功能分隔,尽管发现许多细胞对多种刺激属性选择性[592]。粗条纹和淡条纹比细条纹具有更高的方向选择性[726]。细条纹倾向于颜色选择性,并且对波长组成敏感[800]。尽管如此,V2区功能分隔的确切性质仍有争议[1051],并且在各种刺激属性处理之间存在显著的交叉[1051]。

V1与V2之间的路径目前已知是双向的[1050],其中V1中的斑块连接到细条纹,斑块间连接到V2中的粗和淡条纹[1051]。这些投射是完全分隔的[490]。V2区也存在显著的反馈到V1[971],尽管这些反馈投射的组织刚刚开始显现[38, 726, 1044, 1251]。移除这些反馈连接的效果仅对V1神经元的反应产生微小变化[511, 993]。这些反馈投射可能改变了周围抑制电路的空间范围[1033],增加刺激的显著性[510],或可能帮助消除歧义[854]。

4.5.3 Area V3 V3区

当前技术尚未揭示V3区内解剖或功能上的独特区隔,尽管已经报告了柱状组织[4]。此外,对该区域中神经元的生理学知之甚少[308]。V3可能在整合不同的刺激属性中发挥作用,帮助视觉感知。也有人提出该区域涉及三维形态的分析[4]。

V3中神经元对不同刺激属性的选择性与V2相似,不同之处在于V3中方向敏感性较高(V3中有40%的细胞对方向敏感,而V2中为20%[592])。大约85%的细胞对方向有选择性,约25%的细胞对大小有选择性,在V2和V3中约50%的细胞对颜色有敏感性[592]。对不同属性的选择性之间没有相关性,这表明不同属性在V3(或V2)中没有沿分隔路径处理。

4.5.4 Area V4 V4区

V4区一直是争议的焦点。基于一种称为色盲的罕见病症,它被认为是颜色中心。色盲使得世界看起来没有颜色,也称为大脑性色盲。这种缺陷与大脑中称为V4的特定部分的病变有关。因此,这一区域可能与颜色感知的计算有关[71, 230, 887, 1289]。然而,需注意的是,这种观点受到若干研究的挑战[282, 407, 1139],因此是否可以将V4视为颜色中心仍然是一个悬而未决的问题[392]。


4.5.5 Area MT MT区

MT区已知参与运动感知。它对运动刺激比静止刺激反应更强烈。在人类[498, 1138]和猕猴[135, 754, 991]中都发现了方向选择性神经元群体。该区域主要对非色刺激敏感。
 

4.5.6 Retinotopic Maps 视网膜定位图

眼睛的光学系统将图像投射到视网膜上,其中相邻的光感受器成像相邻的视网膜图像部分。传向视觉皮层的信号通常保持这种拓扑结构。在LGN中,图像特征的空间定位得以保留,因此视网膜图像到该区域中神经元的映射是拓扑性的。该映射称为视网膜定位。

在初级视觉皮层中,这种映射得以保留,尽管中央凹在V1及更远处被表示为相对较大的部分。尽管视网膜图像中的相邻区域仍由相邻的神经元簇表示,但在V1中,映射经历了对数极坐标变换。这意味着沿一个维度,对应于中央凹的对数距离被映射,另一个维度表示相对于视网膜图像的(任意选择的)水平轴的极角(图4.24)。视网膜定位图存在于V1区以及V1以外的区域,尽管距离V1越远,这种组织的精度越低[393, 394, 432, 677]。

视网膜到中央凹的距离与在初级视觉皮层表面测量的距离之间的对数关系导致大面积的皮层用于处理源自中央凹的信号。这被称为皮层放大[268, 1017]。


 

4.5.7 Summary 总结

随着对通过视觉皮层模块的隔离路径的简单模型的改进,现在归因于视觉皮层各独立区域的特定功能还为时过早。确切的处理过程尚未解开,因此也不适宜将更高级的人类视觉系统功能归于某一基质。这适用于初级视觉皮层,也适用于视觉皮层中的其他处理。

依赖于测量视觉皮层功能特征的技术,可能会得出不同的结论。例如,有人支持颜色、运动、形态等的隔离路径,也有人支持分布式的特征处理,认为视觉皮层中的功能区域对运动、形态、方向、取向、颜色等的组合敏感。

从感知角度来说,也无法得出单一结论。尽管一些感知属性似乎与其他属性分离,这并不总是绝对正确[1202]。例如,物体的表观速度与其对比度和颜色有关[159],而高空间和时间频率则表现出脱饱和[908]。

确定视觉皮层功能结构的一个难题是当前可用方法的局限性。大多数方法使用点方法,即通过单细胞记录或示踪剂微注射记录单个神经元的反应。考虑到存在的神经元数量及其庞大的互联网络,所面临的问题显而易见[494]。尽管如此,未来有希望的是,新的技术正在出现,这些技术允许在细胞分辨率下对大群细胞进行成像[846]。

因此,在接下来的章节中,我们将转向另一种完全不同的策略,以了解人类视觉系统中(包括颜色处理)所发生的处理,即心理物理学。在这里,人类视觉系统被视为一个黑箱,通过测量任务反应揭示其一些功能。

4.6 A Multi-Stage Color Model 多阶段颜色模型

构成可见光谱的波长可以排列成一个圆。0°、90°、180°和270°角被选择与LGN中隔离两种对立神经元反应的刺激重合[209],如表4.3所示

每种颜色的相对强度经过调整,使得所有颜色看起来同样明亮。特别是,沿L-M轴的对比度为L锥体为8%,M锥体为16%,而S锥体的对比度为83%[1175]。中间角的对比度通过插值计算。由此产生的颜色被称为等亮度。这种配置被称为MBDKL色彩空间,以Macleod, Boynton, Derrington, Krauskopf和Lennie命名[250, 722]。此色彩空间的计算细节见第8.6.3节。

尽管其轴常被称为红-绿和黄-蓝,它们实际编码的颜色如上所述。因此,LGN使用的色彩空间轴不与红、绿、蓝和黄的感知维度重合,这些维度在MBDKL色彩空间中旋转。Russell和Karen de Valois假设,通过将S信号添加或从L和M对立细胞中减去,红、绿、黄和蓝的感知色彩系统由LGN输出形成[1171]。

由Russell和Karen de Valois提出的多阶段颜色模型由四个独立的阶段组成。以下部分将讨论这些阶段[1171]:

  1. 三种锥体类型,具有三到五种色素;
  2. 锥体对立性;
  3. 感知对立性;
  4. 复杂细胞的颜色选择性。

4.6.1 First Stage 第一阶段


当前广泛接受的是三锥体模型,每种锥体包含单一的色素。然而,可能存在两种L锥体色素变体,其峰值灵敏度相差几个纳米,可能还存在类似的M锥体色素对[823]。L:M:S 锥体的比例为10:5:1。S锥体假设为规则间隔,而L和M锥体聚集在一起。
 

4.6.2 Second Stage 第二阶段

假设第二阶段发生在视网膜中,并参与形成光谱对立和非对立信号。在该模型中,水平细胞汇总其输入,这些输入来自空间区域内的若干锥体,计算出L+M+S信号。在双极细胞层面,侏儒双极细胞计算L - (L+M+S)、M - (L+M+S)和S - (L+M+S)信号。这种表示方式表明中心由L、M或S形成,空间周围是(L+M+S)。为了简洁,这些信号被记作Mo、Lo和So。

此外,还计算了相反的信号:-L + (L+M+S)、-M + (L+M+S)和-S + (L+M+S),假设空间周围由局部邻域内所有L-、M-和S-锥体不加区别地汇总。这些信号是小细胞路径的起点。这些信号也写作-Lo、-Mo和-So。

中心和周围的强度大致相同。考虑到锥体比例,对于Lo,模型因此将16L权重用于中心,对抗10L + 5M + S的周围:

在离散模型中,弥散双极细胞加权为6L - 5M。在任一种情况下,结果都接近传统的“红-绿”颜色对立细胞。同样的情况适用于Mo和So,它们最终被加权为11M - 10L - S和15S - 10L - 5M。

弥散双极细胞似乎接收来自少量L-和M-锥体的输入,以及来自水平细胞的周围输入。因此,弥散双极细胞计算的信号被指定为L+M - (L+M+S)和-L-M + (L+M+S),形成了大细胞路径的起点。

4.6.3 Third Stage 第三阶段

在第三阶段中,建模感知对立性。弥散双极细胞的输出,通过伞形神经节细胞和LGN的小细胞层,被假定为继续分开,并形成明视觉函数(见第6.1节)。

多阶段颜色模型的第三阶段中,六种小细胞LGN类型Lo、Mo、So、-Lo、-Mo和-So经历了进一步的变换。LGN细胞对亮度和颜色变化都有反应,但具有不同的感受野[1170]。例如,一个Lo细胞对于亮度增加有兴奋中心和抑制周围。这种行为的原因是L-和M-锥体对亮度变化反应相似,从而驱动中心和周围朝相反方向运动。

然而,同时,如果颜色变化是向较长波长的等亮度变化,该细胞对颜色的均匀兴奋响应。在这种情况下,L-和M-锥体朝相反方向运动,在Lo细胞处产生协同响应。因此,第二阶段的细胞将亮度和色度信息混淆。对于LGN中的其他五种细胞类型也有类似的论证。例如,-Mo细胞对于亮度变化具有抑制中心和兴奋周围,但对向较长波长的色度变化有均匀兴奋响应。

然而,可以通过特定方式重新组合第二阶段细胞的输出来分离颜色和亮度信息。例如,在第三阶段对Lo和-Mo求和可以消除对亮度的敏感性,只对色度变化响应。而对Lo和-Mo的求和,则会取消色度响应性,提取亮度。因此,Lo - Mo和Mo - Lo形成对红到绿和绿到红变化敏感的色度信号。同样,Lo + Mo和Mo + Lo是空间对立的亮度信号。

在该模型中,第三阶段主要由Lo和Mo信号主导,对感知红-绿和黄-蓝系统都有贡献。因此,假设M-锥体是蓝色信号的主要贡献者。So信号然后用于调节这一主要的L/M路径以检索感知的红、绿、黄和蓝色彩轴。特别是,这些颜色系统可以通过将So添加或从Lo - Mo和Mo - Lo细胞中减去来计算。这四种可能的组合列在表4.4中。

假定So对四个颜色系统的贡献权重不同。为了匹配色相标度实验[1174],So在感知红系统中的权重为1.0,绿为2.0,蓝为2.0,黄为3.5。三种锥体对这些四个感知色彩轴的贡献如表4.5所示。

4.6.4 Fourth Stage 第四阶段


已经显示大多数简单细胞产生半波整流输出。第四阶段产生这样的输出。位于V1以外的复杂细胞然后可以通过汇总两个半波整流的简单细胞反应来建模。
 

4.6.5 Neurophysiological Experiments 神经生理学实验

基于 MBDKL 色彩空间,已经进行了一系列神经生理学和心理物理学实验来支持这一观点 [209, 1174–1176]。图 4.25 显示了在猕猴的外膝状体(LGN)中测量到的色彩反应。作为色彩角度函数的 LGN 反应很好地用正弦函数来建模,表明从光感受器传递的输入在 LGN 中进行了线性重组。

LM 对立细胞的最佳调谐方向是 MBDKL 空间中的 0°-180° 轴。M 中心细胞(+M-L 和 -L+M)平均在 180° 和 0° 达到最大响应。L 中心细胞(+L-M 和 -L+M)的峰值略有偏离轴线,分别位于约 345° 和 165°。+S-(L+M) 细胞在 90° 达到峰值。一般来说,LGN 细胞对沿 0°-180° 和 90°-270° 轴的颜色反应强烈,而对其他颜色反应较弱,如图 4.26 所示。
 

该图还展示了一组皮层细胞的色调调谐。尽管皮层细胞对各种不同颜色的调谐,但在 0°-180° 和 90°-270° 轴附近存在明显的下降 [1175]。其他研究也在 V1 区域发现了类似的广泛调谐分布 [669, 1127],尽管有些实验显示某些细胞类型对红、绿、黄和蓝有离散的响应 [1147, 1180]。

虽然LGN细胞对输入的反应是线性的,V1细胞则表现出各种非线性。这些非线性可以用在MBDKL空间中的指数正弦函数来建模:

这里,反应 R 被建模为增益 A 、待研究的颜色轴 C 和相位 φ 的函数。指数 n 代表非线性的程度。图4.27显示了适合单个细胞反应的LGN和V1细胞指数的分布。V1细胞的中位值为1.90,表明近一半的细胞表现出显著的非线性行为。

指数 n 大于1的解释是这些反应更为尖锐,即反应限于较窄的波长范围。这可以从图4.28中看到,图中绘制了不同 n 值的指数正弦函数。

4.6.6 Psychophysical Experiments 心理物理实验

在另一个心理物理实验中,对比了大刺激(视觉角度为2°)和小刺激(视觉角度为0.1°)的反应,两者均呈现在中央凹区域[1176]。由于中央凹缺乏S-锥体,小刺激只激活L-和M-锥体,而大刺激激活所有三种锥体。2°颜色尺度实验的结果如图4.29所示。

再次强调,红、绿、蓝和黄的峰值不与LGN细胞的峰值重合,而是发生了旋转。其次,图形的形状并非正弦,而是更适合用指数正弦曲线(4.16)来建模。红、绿、蓝和黄的指数分别为1、1.7、1.8和2.9。

对于呈现于中央凹的小刺激,S-锥体几乎不参与颜色感知[1176]。因此,90°和270°角的刺激往往不被察觉。小刺激的颜色标度结果如图4.30所示。此时,90°到270°范围内的刺激几乎同等被感知为绿和蓝。270°到450°之间被看作红,带有少许黄色成分。

因此,缺乏S-锥体输入导致颜色外观均匀的两个区域。S系统的贡献总结在表4.6中。可以看出,S-锥体信号对绿和蓝的感知有重要贡献。这与V1中的模型一致,即S信号添加到+M-L细胞形成蓝色,并从-M+L细胞中减去形成绿色。同样,这些发现也与将S-锥体信号添加到+L-M信号以形成红色、从-L+M信号中减去以形成黄色的模型一致。
 

此外,在没有S-锥体输入的情况下,反应没有峰值。这表明V1中的反应尖锐化是由于S-锥体路径的贡献。

4.6.7 Discussion 讨论

大细胞路径传统上被认为主要负责传递亮度信号。在多阶段模型中,这条路径传递的主要是类似V(λ)曲线的亮度信息(见第6.1节)。然而,也有证据表明小细胞路径可能传递与颜色信息多路复用的非色信息[1170, 1173]。多阶段颜色模型能够模拟这一点,并在皮层阶段分离色度和非色信息。

在这个模型中,L-和M-锥体是红-绿和黄-蓝系统的主要输入。在第三阶段,S-锥体调节这个主要路径以构建感知颜色轴。这表明,蓝色系统的主要输入由M-锥体形成,而不是S-锥体。这一特性与对三色盲的测量一致(三色盲见第5.11节),他们缺失或S-锥体功能失常。通常他们会将所有小于570 nm的波长视为蓝色或部分蓝色。然而,S-锥体对波长高于520 nm的光不反应。在520到570 nm之间检测到蓝色的间隙不能被传统的颜色模型解释,但可以用多阶段模型解释。

最后,感知颜色轴的旋转与色相消减实验[515]以及跨文化颜色命名研究[87, 449]一致。

4.7 Alternative Theory of Color Vision 替代的颜色视觉理论

本章迄今为止集中于公认的颜色视觉理论。然而,最近出现了一种引人注目的替代理论,可以看作是对人类视觉已知事实的补充。该理论涉及光子在光感受器中的电信号转导。

可以认为,当前理论和测量中存在一些不寻常之处。首先,中央凹中蓝锥体的缺失似乎并不妨碍中央凹区域的颜色感知。其次,L-和M-锥体的随机分布似乎对颜色视觉没有明显影响。如果假设每种锥体类型由一种光感色素表征,这一点就显得很奇怪。

此外,最近的研究首次能够通过校正眼内介质的光散射来探测单个锥体[476]。通过用600 nm、550 nm和500 nm波长的单色光刺激单个锥体,期望根据锥体类型,引发相应的红、绿或蓝感觉。然而,结果并非如此,研究结论是锥体反应的多样性不能完全用L-和M-锥体激发来解释。相反,单个锥体似乎能够产生一种以上的感觉。

颜色视觉中另一个无法用三受体模型解释的反直觉特性最早由廷德尔[1158]报道,并由莫伦和埃斯特维斯[786]讨论。他们观察到,在455 nm附近,当加入白色去饱和光时,波长辨别能力提高。对于三锥体机制,任何波长辨别在加入白光后都应降低,因此廷德尔的发现无法用当前的颜色视觉理论很好地解释。

当前颜色视觉模型中还有许多其他异常[771]。不逐一列举,我们提到另一个显著的观察。可以将红光和绿光混合形成黄光,也可以构造单色黄光。这两种黄光被视为相同的,即它们是同色异谱的(见第7.2.1节)。然而,当一条垂直的黄条水平穿过视野时,单色黄保持黄,而混合的黄则被分解为红色前缘、绿色后缘和黄色中间区域。这一现象最早由艾夫斯在1918年注意到[539]。

在三锥体模型中,即使不同锥体类型有不同的时间常数,这一结果的解释也是有问题的。特别是,预计移动的颜色混合物可以被分解为红绿边缘。然而,预计单色黄条也应该被分解为红前缘和绿后缘,因为两种刺激对每种锥体类型的量子捕获应是相同的。这与实验结果相反。

虽然三锥体模型能够解释许多视觉现象,并且是大多数工程相关学科应用的有用起点,但有足够多的观察无法用该模型解释。因此,有必要提出可能解释相同现象的替代假设,但除此之外还解释了当前模型失败的某些情况。

其中一种模型考虑了光感受器的形状。特别是,介导颜色视觉的受体的锥形可能是重要的。在第2.5节中,我们展示了一个与周围区域有不同折射率的管子可能由于全内反射而导光。如果管子的横截面做得非常小,大约是单个光波长的大小,管子就成为一种波导,其特征为波导参数 V [1064]:

 
其中 d 是管子的直径, n1 和 n2 是管子和其周围的折射率,lambda 是波导参数计算的波长。波导参数 V 可用于确定管子是否足够宽,可以用几何光学作为有效模型,或波导效应是否起作用。后者适用于较小的 V 值。对于非常小的 V 值,光无法局限在管子的内部,而是会辐射出去。
 

由于 V 依赖于管子的直径和波长,显然,给定特定的管径,较长的波长无法通过管子传播,而较短的波长可以。将管子替换为锥形圆柱,在宽入口处可以传播多种波长,而在锥体的细端处,仅能传播越来越短的波长。

如果可以沿锥形圆柱的长度读取波长组成,则可以利用波导原理构建光谱仪。事实证明,视网膜中锥体的尺寸和形状使得波导可能发生。因此,不论每个锥体中存在哪种光感色素或其组合,锥体都有可能作为波导。

然而,该颜色视觉模型目前尚未被广泛接受。尽管它似乎解释了一些当前人类颜色视觉模型无法解释的现象,但还需要进一步的研究,以确定人类视网膜中的锥体是否利用波导来介导颜色视觉。目前,该模型与现有文献一致。然而,直接验证此模型尚未进行。

4.8 Application: Modeling a Human Retina 应用:人类视网膜的建模

所有显示器和渲染算法产生的刺激最终都是供人类观看的。因此,一个相对完整的人类低级视觉模型可能有助于评估图像实际的感知方式。例如,该模型可以帮助评估在新硬件制造之前显示在该硬件上的图像的视网膜图像质量[243]。对于渲染算法,这样的模型可能有助于评估渲染流程中可以进行哪些简化。

迪尔林提出了一个模型,该模型考虑了眼睛光学、光感受器马赛克以及锥体对光子的转导(排除了视杆,因此该模型仅适用于光照条件)[243]。作为模拟的一部分,涵盖了本章讨论的大部分内容,开发了一种合成人工视网膜的新算法,根据一些简单规则放置和排列锥体。新的视网膜从仅七个锥体开始;一个中心锥体被六个六边形排列的锥体包围。在每次后续迭代中,一个新锥体环被放置在该簇外面。根据锥体创建的位置,它们有较大或较小的解剖目标半径。锥体中心然后向内迁移。

这种迁移受两个规则支配,第一个是遵循每个锥体的目标半径,第二个是尽可能向内移动。对于具有位置 pi 和目标半径 ri 的一对锥体,归一化距离 d 定义为:

 
当 d(i, j) >= 1.5 时,锥体 i 和 j 被定义为邻居。
然后锥体的位置使用锥体力方程迭代更新:

 
这里, n 是指向视网膜中心的向量,$r$是一个随机向量,使得 |r| ∈ [0,1] 。系数 k1, k2 和 k_3 是常数,s 是一个插值函数,定义为:
 

这些迁移步骤执行25到41次,使锥体在模式中定居。迁移迭代的上限导致一个混合的规则和不规则的视网膜马赛克,类似于真实的视网膜。在中央凹外,执行较少的迁移迭代,以模拟那里视网膜排列较不规则。

一旦当前锥体环迁移完成,下一次迭代开始,通过用一个新的锥体环包围当前簇,随后会向内迁移。

可以用多种模型中的任何一种来建模每个锥体的反应。最近一个预测大量测量结果的模型由范·哈特伦提出[434]。它基于对涉及光转导的各个阶段的最新知识。对于该模型的完整描述,鼓励读者查阅参考文献[434],该文献可在《视觉杂志》网站上免费获取。由于模型的详细信息超出了本书的范围,以下部分仅概述此模型。

基本构建块是时间低通滤波器、静态(非)线性滤波器以及减法和除法反馈环路。每个这些构建块形成对某些光感受器功能的合理模型,无论是细胞还是分子水平。低通滤波器将输入 x(t) 转换为输出 y(t) ,公式为:

 
该方程也可以写成微分形式:

在图4.31中,处理功能的级联通过一个控制流图示出。四个主要块是光转导阶段、钙反馈环路、发生在内节的处理,最后是水平细胞反馈。虽然此流程图中的常数和函数在范·哈特伦的论文中有详细描述[434],但此处仅展示以显示对人类视觉第一阶段,即单个锥体中的光感受过程建模所需的复杂性。

将这种复杂性与第4.3.3节讨论的简单S型反应函数(Michaelis-Menten或Naka-Rushton)比较。这些模型将光感受器视为具有输入和输出的黑箱,而当前模型则包括定义锥体功能的大部分分子和细胞组分。此外,还考虑了时间方面(除了漂白等慢过程)。

无论偏好哪种模型,现在已知灵长类外视网膜的大部分灵敏度调节已经存在于水平细胞中,并可以在那里测量[1057]。这是必要的,并且与此处讨论的模型一致。

该模型对于视觉计算中的应用非常有用。例如,已显示其能够对高动态范围视频进行编码[435]。

4.9 Further Reading 延伸阅读

赫贝尔的书《 Eye, Brain, and Vision 》可在以下网址找到:http://neuro.med.harvard.edu/site/dh/ [496]。另一个优秀的在线资源是Webvision,网址为http://webvision.med.utah.edu。关于人类视觉的经典著作包括Cornsweet [208]、Wandell [1205]和Palmer [868]。大量关于视网膜的信息可以在Dowling [262]中找到,眼睛的解剖和组织学由Forrester等人详细描述[329]。由Gegenfurtner和Sharpe编辑的论文集深入探讨了早期视觉处理,包括介导视觉的分子结构 [353]。


参考文献:


见 彩色成像的基础和应用 原理 Principles (论文引用目录)篇

  • 3
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值