摘要:CNN在多种视觉识别任务上取得了很好的识别性能,大量的带标记的训练集是CNN成功的重要因素。然而,在一些领域(如年龄估计,头部姿态估计,多标签分类和语义分割等)很难获得有准确标记的足够的训练图像;幸运的是,标签之间有模糊信息(ambiguous information)。
提出的DLDL(Deep Label Distribution Learning) 方法有效的在特征学习和分类中利用了标签模糊(label ambiguity),它有助于防止训练集较小时的网络过拟合。
LDL过程分两步:
1.从图像中提取特征(learning the visual representations/feature learning)
2.利用特征和对应的标记分布LD,学习特征和LD之间的映射关系(classifier learning)
现有的传统LDL方法的问题:
these methods are suboptimal because they only utilize the correlation of neighboring labels in classifier learning, but not in learning the visual representations
Deep ConvNets
- 优:have natural advantages in feature learning
- 缺:requires a lot of images
- 缺:cann