自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(3)
  • 收藏
  • 关注

原创 【论文精读】OmniDrive: 基于反事实推理的自动驾驶整体视觉语言数据集

【摘要】本文提出OmniDrive,一个基于反事实推理的自动驾驶视觉-语言数据集,并设计两种LLM智能体框架:基于2DVLM扩展的Omni-L和基于3D感知融合的Omni-Q。研究通过反事实检查表和模拟轨迹生成高质量问答对,在nuScenes等数据集验证表明,Omni-L凭借更强的语言理解能力在综合任务中表现更优。实验揭示了2DVLM扩展路径在自动驾驶领域的优势,为视觉-语言模型在3D驾驶任务中的应用提供了新思路。该成果发表于CVPR 2025。

2025-10-17 16:29:48 1572

原创 【论文精读】Holmes-VAU: Towards Long-term Video Anomaly Understanding at Any Granularity

【论文引用】H. Zhang et al., "Holmes-VAU: Towards Long-term Video Anomaly Understanding at Any Granularity," 2025 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR)

2025-10-16 10:09:53 1895

原创 Python高效下载实战技巧大全

【代码】Python高效下载实战技巧大全。

2025-10-16 09:45:50 571

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除