2019年,清华大学团队写了一篇探究颜色空间对图像分类重要性的文章colorNet。
paper《ColorNet: Investigating the importance of color spaces for image classification》。
目录
文章结论
- 在图像分类领域,使用不同的颜色空间(RGB/HSV等),分类效果具有显著差异;
- 不同的颜色空间对于分类中的部分类别有独立性。例如,一颜色空间对A类的分类效果好,另一颜色空间对A类的分类效果差;
- 基于上述2中的独立性,可以选择集成(融合)多个颜色空间,可以明显提升分类效果。
网络结构
每个颜色空间使用一个DenseNet提取特征,得到类别向量(本人复现时,未作softmax),把所有的类别向量输出到一个Dense Layer,学习类别向量的权重,最后给出综合的类别向量。
复现关键点
论文的融合过程特别重要。本人理解如下。以10分类为例。
- 设每个DenseNet的输出为,为颜色空间数量;
- 融合的输出为
复现结果
本人在cifar-10数据集复现论文的效果,使用的基本网络为resnet18,使用了3个颜色空间RGB/HSV/LAB。
颜色空间(组合) | 测试集准确率 |
RGB | 0.8396 |
HSV | 0.7842 |
LAB | 0.8028 |
RGB+HSV+LAB | 0.8594 |
上述结果体现了之前的结论。