-----学习心得主要基于以下两篇文献-----
1、Towards Open World Object Detection
论文地址:https://arxiv.org/abs/2103.02603
2、Towards Open Vocabulary Learning: A Survey
论文地址:https://arxiv.org/abs/2306.15880
结论 :
(1) Open Set Detection/Classification: 训练数据不包含未知类别,测试数据中包含未知类别。但是对存在多种未知类别的情况均标记为
u
n
k
o
w
n
unkown
unkown,不进行进一步细分(如
u
n
k
o
w
n
1
unkown_1
unkown1、
u
n
k
o
w
n
2
unkown_2
unkown2)
(2) Open World Detection/Classification: 训练数据是包含已知和未知类别的,测试数据中也包含已知和未知类别。但是对存在多种未知类别的情况均标记为 u n k o w n unkown unkown,不进行进一步细分(如 u n k o w n 1 unkown_1 unkown1、 u n k o w n 2 unkown_2 unkown2);同时包含增量学习过程,即在后续逐步认识未知类相应的标签时,增量地学习这些已识别的新类别,而不遗忘先前学习的类。
(3) Zero Shot Learning: 训练数据为已知类别,测试数据只包含未知类别。但是对存在多种未知类别的情况需要进行进一步细分(如 u n k o w n 1 unkown_1 unkown1、 u n k o w n 2 unkown_2 unkown2)
(4) Out-of-Distribution Detection: 训练数据处于同一个分布,但是测试时可能会遇到来自不同于训练数据分布的数据。
(5) Open Vocabulary: 设未知类别 ∈ \in ∈ Q Q Q,训练数据为已知类别 ∈ \in ∈ P P P,输入为( x i x_i xi, y i y_i yi, l i l_i li),其中 y i y_i yi ∈ \in ∈ P P P, l i l_i li是视觉感知对应的语言词汇数据, l i l_i li ∈ \in ∈ L L L, L L L所描述的类别空间并不严格要求包含 P P P 或者 Q Q Q,也可能在他们之外,测试数据包含已知和未知类别,即 P P P ∪ \cup ∪ Q Q Q。
认识较浅、有误区的地方欢迎指正。