1 learning a deep convnet for multi-label classification with partial labels
深度学习在单标签分类任务中表现很好,但是日常生活中的图像本质上是多标签的。多标签分类比单标签分类更困难,因为输入图像和输出标签空间都更复杂。与单标签相比,大规模收集干净的多标签注释更难。为了降低标注成本,我们建议训练带有部分标签的模型,即每个图像只知道部分标签。
setting:共三种1. 全标签;2. 分类多标签,图片部分标签缺失;3. 部分标签有误
https://zhuanlan.zhihu.com/p/58135763
2 HRNet
先前的分类将分辨率从高到低的卷积串行连接,HRNet则是并行连接。
高分辨率网络 (High-Resolution Network,HRNet)
关于多分辨率表征信息交换,这里以三个分辨率输入和三个分辨率输出为例,如图4所示。每一个分辨率的输出表征都会融合三个分辨率输入的表征,以保证信息的充分利用和交互。将高分辨率特征降到低分辨率特征时,我们采用stride为2的3x3卷积;低分辨率特征到高分辨率特征时,先利用1x1卷积进行通道数的匹配,再利用最近邻插值的方式来提高分辨率。相同分辨率的表征则采用恒等映射的形式。
https://www.jiqizhixin.com/articles/2019-05-22-8