VLA
文章平均质量分 92
leo0308
兴趣领域: 大模型, 具身智能。
github: https://github.com/leo038
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
流匹配(Flow Matching)通俗讲:从噪声到数据的一条「流」
推理是另一条离散时间网格,只要从噪声端积分到数据端即可,不必与训练分布相同。,逼网络在整个路径上都学会方向,而不是只会处理「很噪」或「几乎干净」的一种情况。二者都能从噪声生成数据;流匹配把「去噪」改写成「沿流场积分」,公式往往更干净。,形式简单(常见为 MSE),不需要扩散里复杂的噪声调度推导。告诉网络「当前在路径的哪一段」,它才能从。长什么样,预测「应该往噪声方向怎么走」;不关心「一共要扩散多少步」,而关心:若沿直线从。,如文本、图像、机器人状态),让它在随机采样的。,从噪声动作出发,多步积分得到。原创 2026-05-27 15:56:25 · 506 阅读 · 0 评论 -
深入解析 π₀ 与 π₀.5:Physical Intelligence 的机器人基础模型演进
│ VLA 模型演进路线 ││ ││ 第一代 VLA(RT-2, OpenVLA) ││ └── 离散动作 token,精度低,速度慢 ││ │ ││ ▼ ││ ├── Flow Matching 连续动作 ││ ├── 双专家架构 ││ └── 灵巧操作能力强,但泛化有限 ││ │ ││ ▼ ││ ├── Co-Training 多源数据 ││ ├── 层次化推理 ││ └── 开放世界泛化能力 ││ │ ││ ▼ ││ 未来:更强的推理、规划、自主改进能力 ││ │。原创 2026-02-01 17:30:35 · 1117 阅读 · 0 评论
分享