- 博客(3)
- 收藏
- 关注
原创 【论文精读】OmniDrive: 基于反事实推理的自动驾驶整体视觉语言数据集
【摘要】本文提出OmniDrive,一个基于反事实推理的自动驾驶视觉-语言数据集,并设计两种LLM智能体框架:基于2DVLM扩展的Omni-L和基于3D感知融合的Omni-Q。研究通过反事实检查表和模拟轨迹生成高质量问答对,在nuScenes等数据集验证表明,Omni-L凭借更强的语言理解能力在综合任务中表现更优。实验揭示了2DVLM扩展路径在自动驾驶领域的优势,为视觉-语言模型在3D驾驶任务中的应用提供了新思路。该成果发表于CVPR 2025。
2025-10-17 16:29:48
1572
原创 【论文精读】Holmes-VAU: Towards Long-term Video Anomaly Understanding at Any Granularity
【论文引用】H. Zhang et al., "Holmes-VAU: Towards Long-term Video Anomaly Understanding at Any Granularity," 2025 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR)
2025-10-16 10:09:53
1895
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅