颜色特征怎么在kcf算法中得出高斯响应矩阵的代码_基于Itti Koch算法的建筑视觉显著性研究——过白的空间解析...

过白,是传统建筑群空间序列经营的常用方法,让人在确定的观赏点上能够看到经由近景景框剪裁或镶框处理的画面,并纳入适当的天空留白,构图完美。形成过白的关键在于合宜的视距和视角控制,使“在观赏效果方面,常能同时达到‘近相住形,虽百端而未已’,‘远以观势,虽略而真’,使近形的丰姿与与远势的气概巧妙融汇,相得相济,出神入化,予人丰富的视觉艺术感受。不言而喻,这正是风水形势说‘于大者,远者之中求其小者、近者,于小者,近者之外求其远者、大者,则势与形胥得之矣’的追求目标。”[1] 可见,传统形势说是将过白观赏点作为从“远势”到“近形”的空间转换点,这与大量实例的空间感受是一致的。本文即尝试以建筑视觉显著性的研究来验证过白观赏点设定的视觉机制。

一、过白的视觉机制

王其亨先生在《风水形势说和古代中国建筑外部空间设计探析》一文中对建筑空间的“形”与“势”作出全面深入的分析,概要来说:“远为势,近为形;势言其大者,形言其小者”;“百尺为形”,折算约23~35米,是近观时的视距标准,对建筑单体的空间构成具有体量尺度的制约;“千尺为势”,折合约230~350米,以之作为基本模数来控制建筑群体的空间围合尺度和远观视距。[1]121~122

熊明先生在《城市设计学——理论框架、应用纲要》一文中从建筑场的角度分析了视距和建筑体量、形态和细部的关系,并据此区分视觉感受的强弱:在晴天无眩光的自然天光下,空气含总悬浮颗粒物不超过三级,观察对象为非发光体,视力不低于1.0的观察者,在视距小于30m时,可以看清建筑物的几乎一切细部和色彩;小于300m时,可以看清建筑的几乎一切轮廓变化和门窗;当接近600m时,尚能看清建筑大轮廓和门窗;再远则只能看见天际线。……将建筑场按强弱及范围划分为强场、均衡场、弱场、虚场四级。[2] 并引“千尺为势,百尺为形”的形势说为证。

9ca818e5d2e06dc2e864ed25d2504aee.png

图1 传统形势说与建筑视觉场的对位关系

综合两文来看,建筑空间的形与势可作如下归纳(图1):形,以传统的“百尺”(23~35米)做为视距边界,在此范围内人眼首要关注的是建筑的具体细部,或者说是非边界的部分;势,以传统的“千尺”(230~350米)作为视距边界,由此开始人眼最先扫描的是建筑各部的主要轮廓。从“千尺”到“百尺”的区间因在“形”之前,仍应属“势”的范畴,此间视觉优先注意的仍是建筑各部轮廓。

传统形势说对于“过白”观赏点的解释为:“形乘势来”,“势止形就,形结势薄”[3],即为“远势”和“近形”的交汇过渡处。直白来讲,就是在由远势及近形的建筑观察过程中,从过白点开始,建筑外轮廓对视觉的刺激开始降低,建筑内部细节开始引起视觉关注。也就是说,过白是从势的轮廓感知到形的细节感知的转换点,即从建筑各部轮廓的视觉扫描到具体细部的视觉关注的变化点。这种随视距变化而视觉关注转变,是由于关注目标的视觉显著性差异而经选择注意机制筛选的结果。

在视觉认知上,视觉场景图像中的各区域目标对于观察者来说并非一视同仁,因与相邻背景具有较为明显的视觉差异,一些区域目标更容易从其背景中“跳出”(pop-out)而让大脑优先做出响应。场景图像中不同区域目标在主观感知质量上的这种差异称为视觉显著性(Visual Saliency),而大脑对视觉显著性高的区域目标进行选择性先行关注的机制则称为选择注意机制(Selective Attention Mechanism)[4]。受选择注意机制作用,观察者在接近建筑的过程中,建筑整体作为目标从环境背景对比中首先跳出而被识别,所识别的是建筑的轮廓,即为“势”。随着观察者继续接近,场景画面发生变化,建筑整体从目标转变为背景,而建筑内部细节的显著性逐渐加强,并最终从建筑整体背景中跳出引起视觉关注,此时观察者应正好进入“形”的范围。

1998年,Laurent Itti、Christof Koch等人基于视觉生理特性提出Itti - Koch视觉选择注意计算模型,从生物学的角度对视觉注意机制进行简化和模拟,将人类视觉的特征处理过程转化成计算机语言,模拟大脑皮层对视觉信号的处理过程进行计算处理,最终得出视觉显著图。本研究拟借助Itti - Koch计算模型求出建筑细部在视觉关注跳出时的观察位置,并将该位置与传统建筑的过白观赏点进行比对,以验证过白作为形势转换点经验的正确性。

二、Itti - Koch算法模拟

在前述关于过白的研究条件的讨论中,均以建筑的尺度体量、观察者的视距视角作为变量,不涉及建筑色彩与明度,这是本研究的边界条件。因此,在运用Itti - Koch计算模型验证过白观赏点的计算中进行了相关通道的修正:去除颜色和明度通道,保留点方向通道,并加入相位一致性通道。保留点方向通道用来描述建筑各部外轮廓,相位一致性通道用来描述建筑具体细部。

本研究通过实地调研拍摄照片来模拟人眼的图像获取过程,为保证采集的图像等效于人的双眼所见,拍照采用35mm定焦镜头。将获取图像输入通道修正后的Itti -Koch计算模型中,得出关注点和反应时间对应关系,以心理学实验中“最先关注点反应时间”为比对标准,找出图像中建筑内部细节处能够第一时间吸引视觉注意力的点,从而验证过白观赏点位置。具体算法分为初级图像处理、视觉显著图计算[5]和关注点计算[6]三个阶段(图2)。

ad2057a6b47309cf7117d7797bd09a0f.png

图2 Itti -Koch计算模型

1.初级图像处理

初级图像处理包括图像初级编码与二维高斯函数线性滤波。

通过图像初级编码,实现图像从像素到可计算矩阵转换。人眼对图像的获取是基于接受光信号,而大脑无法直接处理光信号,因此需要将光信号转换为电信号。同样计算机无法直接计算像素点,能够进行计算的是数值,因此需要对图像进行编码处理,将图像转换为计算不会溢出的double灰度图,该过程类似于视网膜神经细胞对图像的基本编译。

高斯滤波器是一类根据高斯函数的形状来选择权值的线性平滑滤波器,对于抑制服从正态分布的噪声非常有效,从而提高整个算法的鲁棒性。对图像采取“滤波→抽取→滤波”的循环方式进行二维高斯函数线性滤波,形成9层的图像金字塔。

2.视觉显著图计算

分别对图像金字塔中的9幅图像进行方向特征和相位一致性特征提取,其中方向特征用Gabor滤波器,相位一致性用傅里叶变换和寻找最大值方法提取,得到4个方向和相位一致性的图像金字塔(9层)。然后分别对得到的9层图像金字塔不同层的图像之间进行Center-surround计算,得到24张方向特征图和6张相位一致性特征图,对特征图分别进行线性融合生成方向特征图和相位一致性特征图。最后对这两个通道得到的特征图进行线性叠加,生成视觉显著图(图3)。

565eb63019779a1fd601265b1fd69e85.png

a. 方向特征图

7f7aaa4d262426e1b17c60cb8ab59141.png

b. 相位一致性特征图

de4b9a8a399a7d83dce8a7a8e82fe390.png

c.视觉显著图

图3 特征图和显著图计算结果

方向特征代表物体轮廓,本算法中通过Gabor滤波提取。Gabor滤波器具有较好的鲁棒性,受物体明暗影响较小。为了简化和加速运算过程,将点的方向进行了精简:实验测试表明,当|θ1-θ2|=180°时候,θ1θ2的二维滤波结果一致,因此取值范围是[0°,180°]。根据经验将其减少到最基本的4个方向——0°、45°、90°、135°,此时计算速度和计算模型灵敏性可以兼顾。

选择注意机制中,Center-surround机制对于边缘的显著性具有重要的决定作用[7]。借鉴Center-Surround机制求出图像中不同边缘的显著程度,并且用灰度图表示出来(公式1):

a09995d39f1cb59dbcc2f40f5cf3cd35.png          (1)

其中,c∈{3,4,5},s=c+δδ∈{3,4},θ∈{0°,45°,90°,135°},定义为跨层级运算。

由此求出4个方向、每个方向6张方向特征图,将这24张图进行线性融合得到方向特征图。用同样的方法,通过傅里叶变换和寻找最大值方法对图像金字塔进行滤波,c-s计算(公式2)后得到6张相位一致性特征图,再将这6张图进行线性融合。

62d4646143e6c0d1b2167e6a44ebad8f.png          (2)

最后用线性叠加的方法(公式3)得到视觉显著图。

e8b8b293c4b10057dc1b006c0e728b17.png          (3)

3.计算关注点

将得到的视觉显著图上建立一个尺度为4的二维泄露整合-激发神经元层模型(Leaky integrate-and-fire model neurons),每一个神经元在模拟中是一个电容。将尺度为4的视觉显著图(SM)输入由整合—激发神经元层模型组成的二维WTA(Winner-take-all)神经网络中,以视觉显著图为充电依据对电容进行充电。电压达到阈值的时候,达到电容电压设置为零并停止充电,对这个过程设置禁止返回机制,以计算下一个关注点。依次记录标记位置和电容充电时间,则可以量化标记关注点和显著程度。

按照以上计算方法对独乐寺观音阁的“过白”场景进行计算,结果如图4:

ac496689683122806d65a02ef1ba963e.png

图4 独乐寺观音阁的过白空间解析计算结果

对所采集照片进行显著性计算得到显著图、关注点及其对应的反应时间,但对于关注点是否能够第一时间吸引注意,需要一个更加准确的判断标准。李凌在《视觉注意的神经机制研究(2009)》博士论文中通过心理学实验得出统计测试目标从背景中跳出时间:在滤除颜色明度通道的Visual Search测试条件下,所得平均反应时间为772.2±115.1ms(准确率88.87%)[8],即657.1~887.3ms。由于该时间跨度较大,需要进一步限定数值,使判定“最先关注点反应时间”具有可操作性。Visual Search测试条件下的反应时间直方图(图5)显示,最后一个峰值出现在800~840ms段(取中间值820ms),随后数值明显下降。因此需要对直方图数据进行处理:首先求得820~887.3ms区段数据占200~1500ms区间所有数据的权重,再乘以他们与820ms的差值,用加权平均数的方法算出读秒的增量,最后确定准确的反应时间为825ms。

54beb19098bfbf6198945258adbb6d86.png

图5 Visual Search测试条件下反应时间直方图

(图片来源:李凌.视觉注意的神经机制研究[D].四川:电子科技大学,2009:68.)

以这个数据为基准,在WTA神经网络模拟中,反应时间小于825ms的关注点记为显著区域,反应时间大于825ms的关注点记为非显著区域。结合前述“从过白点开始,建筑外轮廓对视觉的刺激开始降低,建筑内部细节开始引起视觉关注”的判断:过白以外的观赏点,建筑边缘关注点的反应时间均在825ms内,而内部细节关注点的反应时间均超出825ms;过白以内的观赏点,开始有内部细节关注点的反应时间在825ms内。

独乐寺观音阁过白空间解析计算结果符合该规律:过白处(观赏点a)各关注点的反应时间虽在825ms以内,但各点均在建筑外轮廓处;刚过过白(观赏点b)关注点(4767,2119)出现在建筑内部细节,且反应时间为618.8ms,在825ms内。

三、算例验证

独乐寺观音阁只是个例,以下选择故宫的乾清宫与奉先殿、明长陵的祾恩门——祾恩殿——棂星门——方城明楼空间序列作为扩充算例进一步验证。

1.乾清宫与奉先殿算例分析

5cb65a25c4c346fb545ae82f87f0071c.png

图6 乾清宫的过白空间解析计算结果

乾清宫算例选取拍摄点为从乾清门正中开间向北看乾清宫大殿。如图6,从计算结果可以看出:当处在过白景框观察位置时(观赏点a),反应时间在825ms内的关注点均位于建筑周边及过白景框上;当过了过白恰好看不见景框时(观赏点b),首个落在建筑内部的关注点(3025,2197)的反应时间822.2ms,在825ms范围内,建筑细节的显著性开始加强。

ecaaadc6c40dacb640ab8618383a1e83.png

图7 奉先殿的过白空间解析计算结果

奉先殿算例选取拍摄点为从奉先门正中开间向北看奉先殿。如图7,从计算结果可以看出:在过白处场景中,台基和门洞共同形成的景框显著度非常高,所有反应时间在825ms内的关注点均落在过白景框和建筑轮廓附近;在刚过过白的场景中,落在建筑檐口关注点(3991,1630)的反应时间为819.9ms,在825ms范围内,建筑细节的显著性开始增强。

从以上分析可见:过白处建筑外轮廓显著性最高,即“远势”在这一观赏点影响力仍然大于“近形”;但刚过过白的一瞬间,建筑外部轮廓显著性降低,建筑内部细节显著性增强并开始吸引注意力。为了判别过白的这一视觉规律只与视距相关,而不是由于过白景框的作用,因此进一步补充算例验证。

2.明长陵算例分析

传统建筑群体以空间组合见长,而皇家陵寝又是其中在空间序列经营上手法最为纯熟者,过白的空间控制非常准确。因此,算例选取明长陵中轴线上“陵门——祾恩门——祾恩殿——棂星门——方城明楼”的空间序列进行计算分析。另外,为了排除树、云、游客等环境因素的干扰,将过白场景中的景框用Photoshop处理掉再进行计算。

fdaf43d44f2369277babb7bfa025c0ea.png

图8 明长陵祾恩门的过白空间解析计算结果

如图8,祾恩门计算结果显示:在过白观赏点处,反应时间在825ms范围内的关注点没有落在建筑内部的,多数集中在建筑外轮廓处;刚过过白观赏点,点(2366,2278)的反应时间为799.2ms,在825ms范围内,且关注点落在建筑内部细节的区域。

1c082b605b99c9dc57c2c8f6374944c7.png

图9 明长陵祾恩殿的过白空间解析计算结果

如图9,祾恩殿计算结果显示:在过白观赏点处,反应时间小于825ms的关注点均在建筑外部轮廓和周围分布;刚过过白观赏点,建筑内部的关注点(2906,1763)的反应时间为802.4ms,在825ms范围内。计算结果符合规律。

f39df8be7f93d4039b46139a552c1d89.png

图10 明长陵棂星门的过白空间解析计算结果

如图10,棂星门计算结果显示:在过白观赏点处,反应时间小于825ms、落在建筑周围的关注点均在建筑外部轮廓处;刚过过白观赏点,第一个出现在建筑内部细节的关注点(3043,1558)的反应时间为666.2ms,第二个关注点(1832,1895)的反应时间为775.3ms,均在825ms以内。计算结果同样符合规律。

f7db42e126168acf2bcfdd8cf50c4339.png

图11 明长陵方城明楼的过白空间解析计算结果

如图11,方城明楼计算结果显示:在过白观赏点处,反应时间在825ms以内的关注点均落在建筑物的各部轮廓上;刚过过白观赏点,场景中关注点(2526,1921)的反应时间为815.7ms,小于825ms。计算结果同样符合规律。

以上对明长陵的“祾恩门——祾恩殿——棂星门——方城明楼”轴线序列中各过白场景进行的分析计算可以得到相同的实验结果:在过白观赏点处,即使去掉景框和天空,建筑外部轮廓的显著性强,依然能够第一时间吸引视觉关注,即关注点的反应时间在825ms以内,但建筑内部细节不能够第一时间吸引视觉关注,即反应时间大于825ms;刚过过白观赏点,建筑内部细节的显著性增强,并能够在第一时间引起视觉关注,即关注点的反应时间小于825ms。由此可见,过白是人眼视觉选择注意机制在建筑空间上的体现,而通常理解的“景框效应”则是用来强化视觉效果的空间呈现。

结语

佩服古代的大匠先贤们,凭借经验积累就能如此精准地控制空间,并将经验总结上升为形势理论,而诸多的实例分析也验证了该理论的准确性。基于Itti - Koch算法的建筑视觉显著性的模拟计算,以现代视觉机制研究为基础,从理论上验证了形势说中过白观赏点作为形势转换点的准确性;同时从一个侧面说明,建筑视觉场中视距强场的界定也受到建筑各区域显著性变化程度的影响。

合宜的空间尺度控制、完美的空间视觉效果是营造外部空间的基础,这些都是建立在对视觉机制准确地把握与运用上。本研究只是在建筑群外部空间认知方面的浅层探索,希望能够为此类研究提供新的思路方法。

参考文献

[1] 王其亨.风水形势说和古代中国建筑外部空间设计探析[A].王其亨.风水理论研究[C].天津:天津大学出版社,1992:131.

[2] 熊明.城市设计学——理论框架、应用纲要[J].建筑学报,2000(01):6.

[3] 王其亨.清代陵寝风水:陵寝建筑设计原理及艺术成就钩沉[A].王其亨.风水理论研究[C].天津:天津大学出版社,1992:171.

[4] Bruce, N.D.B. & J.K.Tsotsos. Saliency based on informationmaximization[A]. International Conference on Neural Information ProcessingSystems[C]. MIT Press, 2005:155-162.

[5] 显著图计算代码改编自网络开源代码,来源网址:https://download.csdn.net/download/zafir_410/7082215,作者不详。去除亮度、颜色并加入相位一致性显著图算法改编自网络开源代码(Copyright (c) 1996-2005 Peter Kovesi School of Computer Science& Software Engineering The University of Western Australia),来源网址:http://www.csse.uwa.edu.au/.

[6] Dirk Walther and Christof Koch (2006), Modeling attention tosalient proto-objects. Neural Networks 19, 1395-1407. 代码来源网址:http://www.saliencytoolbox.net/

[7] Kandel, E.R & J.H.Schwartz. Principles of neural science / 5th ed[M]. China machine press, 2013:588.

[8] 李凌.视觉注意的神经机制研究[D].四川:电子科技大学,2009:67.

国家自然科学基金资助项目,项目编号:51478296

本文原刊载于《天津大学学报(社科版)》Vol20,2018(05):399~406.

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值