自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(3)
  • 收藏
  • 关注

原创 Uni3D:探索大规模统一3D表示

通过简单的框架和代理任务,Uni3D可以利用丰富的2D预训练模型作为初始化,并将图像-文本对齐模型作为目标,释放了2D模型的巨大潜力,并将策略扩展到3D世界。

2024-06-25 14:55:48 779

原创 ULIP-2:面向 3D 理解的可扩展多模态预训练

ULIP-2是一个简单而有效的三模态预训练框架,它利用大型多模态模型自动生成3D形状的整体语言描述(只需要将3D数据作为输入,消除了任何手动注释的需要,因此可以扩展到大型数据集)。

2024-06-24 15:55:47 807

原创 ULIP(CVPR2023):多模态对齐的最新进展

当前3D视觉识别研究任务仍然受到标注数据少和预先确定类别较少的数据集的限制(a small number of annotated data and a pre-defined set of categories)。受到2D领域的启发,通过语言或其他形式的模态信息可以显著缓解类似的问题。因此,利用多模态的信息,可以有效的帮助并提高对3D的理解。因此,我们引入ULIP来学习图像、文本和3D点云的统一表征,方法是通过使用来自三种模态的对象三元组(object triplets)进行预训练。

2024-06-20 16:17:49 1019 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除