基于patch的CNN网络会因为patch包含的信息不足,无法确定一个唯一的颜色或者范围。在此提出一个基于全卷积网络结构,其中patch可以携带用于估计颜色恒定的置信度权值。权重在一个独特的(novel)pool层中学习和应用,在该层中局部估计被合并到全局解中。用了该公式网络话就知道在数据集中要学习什么并且如何pool而不需要额外的监督。还允许端到端的训练。
网络结构
网络生成的特征图(4维度)被传递到加权池层,从局部到全局进行聚合,生成之前所说的颜色恒定性估计。我们强制前三个通道表示每个对应patch估计出的颜色元组p ̂_i=g(R_i ),最后一个通道表示对最终全局估计的置信度c_i=c(R_i )
然而,由于颜色恒常性问题的性质,最优模型至少受到两个重要性质的约束:
(1)网络应该能够提取足够的语义特征来区分模糊的patches(如无纹理的墙壁)以进行照明估计;
(2)网络不应该是照明不变的,但它应该对不同的灯光颜色敏感。
如我们所见,第二个要求违反了在分类任务训练网络中嵌入的知识,因为照明条件不应影响对象的类别。不幸的是,具有较强语义信息提取能力的网络通常对光照条件的变化也不敏感,这意味着提取的特征对光照颜色具有不变性。为了在上述两个特性之间找到一个很好的平衡,我们尝试了不同的网络配置。我们尝试了一个去掉conv4和/或conv5的较浅版本的AlexNet,发现性能变差,可能是由于语义特征