通过注入语义概念到图像标记(inject semantic concepts into image tagging),提出识别一切+的模型(Recognize anything plus model, RAM++), 一个具有强的开集识别能力的图像识别模型。
RAM++模型能够利用图像-标签-文本三者之间的关系,整合image-text alignment 和 image-tagging 到一个统一的交互框架里。
框架图:
通过注入语义概念到图像标记(inject semantic concepts into image tagging),提出识别一切+的模型(Recognize anything plus model, RAM++), 一个具有强的开集识别能力的图像识别模型。
RAM++模型能够利用图像-标签-文本三者之间的关系,整合image-text alignment 和 image-tagging 到一个统一的交互框架里。
框架图: