论文信息
题目:Do computer vision foundation models learn the low-level characteristics of the human visual system?
计算机视觉基础模型学习到人类视觉系统的低级特征了吗?
作者:Yancheng Cai, Fei Yin, Dounia Hammou, Rafal Mantiuk
论文创新点
- 设计全面测试方案:该论文的作者设计了一套包含九种测试类型的实验方案,涵盖对比度检测、对比度掩蔽和对比度恒常性等方面,全面地对基础模型和生成模型的图像编码器进行评估。
- 测试多模型图像编码器:对45种具有代表性的基础模型和生成模型的图像编码器展开测试,其中包含像DINO、DINOv2、OpenCLIP等极具影响力的大型视觉基础模型,以及生