醉卧花泣血-CSDN博客

原创 Uni3D：探索大规模统一3D表示

通过简单的框架和代理任务，Uni3D可以利用丰富的2D预训练模型作为初始化，并将图像-文本对齐模型作为目标，释放了2D模型的巨大潜力，并将策略扩展到3D世界。

2024-06-25 14:55:48 1386

原创 ULIP-2：面向 3D 理解的可扩展多模态预训练

ULIP-2是一个简单而有效的三模态预训练框架，它利用大型多模态模型自动生成3D形状的整体语言描述（只需要将3D数据作为输入，消除了任何手动注释的需要，因此可以扩展到大型数据集）。

2024-06-24 15:55:47 1443

当前3D视觉识别研究任务仍然受到标注数据少和预先确定类别较少的数据集的限制（a small number of annotated data and a pre-defined set of categories）。受到2D领域的启发，通过语言或其他形式的模态信息可以显著缓解类似的问题。因此，利用多模态的信息，可以有效的帮助并提高对3D的理解。因此，我们引入ULIP来学习图像、文本和3D点云的统一表征，方法是通过使用来自三种模态的对象三元组（object triplets）进行预训练。

2024-06-20 16:17:49 2505 1

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

qq_55964124的博客

原创 Uni3D：探索大规模统一3D表示

原创 ULIP-2：面向 3D 理解的可扩展多模态预训练

原创 ULIP（CVPR2023）：多模态对齐的最新进展

空空如也

空空如也