自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(3)
  • 收藏
  • 关注

原创 特斯拉 FSD V14:从「理解场景」到「挑战路权」——特斯拉的自动驾驶临界点

短短八天,特斯拉连推三版 FSD(V14.1 / V14.1.1 / V14.1.2)。从能“理解等待”的端到端神经网络,到能“敢超人类”的 Mad Max 模式,特斯拉不只是加快了迭代速度,而是押上了整个自动驾驶未来的哲学命题——信任、责任、与速度的博弈。

2025-10-24 16:25:00 1307

原创 当视觉语言模型开始理解三维世界:解读 DeepMind 的 ERQA 评测体系

谷歌DeepMind推出ERQA基准,评估多模态模型在具身推理中的表现。该基准包含400道视觉问答题目,测试模型在空间关系、动作预测和视角变化等三维场景中的理解能力。ERQA采用多选题形式,结合多视角图像和文本提问,重点考察模型的语义层推理而非几何重建。其应用场景包括机器人交互、AR/VR开发和多模态模型评估,标志AI研究从几何精度转向可解释的空间逻辑推理。该工具为Gemini Robotics等具身智能系统提供重要评测指标。

2025-10-22 16:22:57 1828

原创 ACE:从上下文到自我进化

斯坦福大学等机构提出"Agentic Context Engineering"(ACE)框架,通过动态优化语言模型上下文实现自我提升。ACE采用生成-反思-策展三步工作流,将任务经验系统记录为"进化剧本",无需微调即可提升模型表现。实验显示,该方法在代理任务和金融分析中性能提升8.6%-10.6%,显著降低计算成本,使小模型可媲美大模型性能。ACE代表了从参数优化转向上下文精耕的AI开发新范式。

2025-10-15 17:26:25 1511

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除