学习心得【 Open Set, Open World, Zero Shot Learning, Out-of-Distribution Detection, Open Vocabulary】

超大的易拉罐

已于 2024-04-25 08:28:33 修改

阅读量816

点赞数 11

文章标签：深度学习人工智能目标检测

于 2024-04-23 21:26:22 首次发布

本文链接：https://blog.csdn.net/qq_43347887/article/details/138138268

版权

-----学习心得主要基于以下两篇文献-----
1、Towards Open World Object Detection
论文地址：https://arxiv.org/abs/2103.02603
2、Towards Open Vocabulary Learning: A Survey
论文地址：https://arxiv.org/abs/2306.15880

结论：
(1) Open Set Detection/Classification: 训练数据不包含未知类别，测试数据中包含未知类别。但是对存在多种未知类别的情况均标记为 $u nk o w n$ ，不进行进一步细分（如 $unkown_1$ 、 $unkown_2$ ）

(2) Open World Detection/Classification: 训练数据是包含已知和未知类别的，测试数据中也包含已知和未知类别。但是对存在多种未知类别的情况均标记为 $u nk o w n$ ，不进行进一步细分（如 $unkown_1$ 、 $unkown_2$ ）；同时包含增量学习过程，即在后续逐步认识未知类相应的标签时，增量地学习这些已识别的新类别，而不遗忘先前学习的类。

(3) Zero Shot Learning: 训练数据为已知类别，测试数据只包含未知类别。但是对存在多种未知类别的情况需要进行进一步细分（如 $unkown_1$ 、 $unkown_2$ ）

(4) Out-of-Distribution Detection: 训练数据处于同一个分布，但是测试时可能会遇到来自不同于训练数据分布的数据。

(5) Open Vocabulary: 设未知类别 $\in$ $Q$ ，训练数据为已知类别 $\in$ $P$ ，输入为( $x_i$ , $y_i$ , $l_i$ )，其中 $y_i$ $\in$ $P$ ， $l_i$ 是视觉感知对应的语言词汇数据， $l_i$ $\in$ $L$ ， $L$ 所描述的类别空间并不严格要求包含 $P$ 或者 $Q$ ，也可能在他们之外，测试数据包含已知和未知类别，即 $P$ $\cup$ $Q$ 。

认识较浅、有误区的地方欢迎指正。

超大的易拉罐

关注

11
点赞
踩
13

收藏

觉得还不错? 一键收藏
0
评论
学习心得【 Open Set, Open World, Zero Shot Learning, Out-of-Distribution Detection, Open Vocabulary】

学习心得【Open-Set, Open World, Zero-Shot Learning, Out-of-Distribution Detection, Open Vocabulary】
复制链接

扫一扫