自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(24)
  • 收藏
  • 关注

原创 具身智能:千金难买数据贵,DemoGen一条抵万金

DemoGen技术通过全合成演示生成框架,实现机器人从单次人类演示中"举一反三"。其核心利用任务与运动规划(TAMP)和3D点云编辑,将演示分解为运动段和技能段,通过算法生成适应不同位置的虚拟数据。实验显示,仅需1次演示生成的100-200条合成数据,即可达到25次人类演示的效果(成功率88%),降低20倍数据采集成本。该技术支持单/双臂操作,在抓取、搬运等任务中展现出色泛化能力,且生成速度达0.01秒/轨迹。尽管存在视觉失配等局限,DemoGen为智能制造、家庭服务等领域提供了高效的机器人学习方案。

2025-05-29 16:06:40 845

原创 一天吃透一条产业链:具身智能产业全景分析

一文带你吃透具身智能产业链

2025-05-14 14:16:00 731

原创 仓颉造字,亦可造AI代理

CangjieMagic是一个突破性的LLM Agent开发平台,基于仓颉编程语言构建。作为首款此类平台,它引入了新颖的Agent DSL(领域特定语言)架构、原生支持MCP(可能是“Magic Communication Protocol”)通信协议,以及高级智能规划功能。CangjieMagic于2025年3月开源,标志着智能Agent开发领域的一次重大飞跃,为开发者提供了一个强大而灵活的框架,用于创建复杂的AI驱动应用。定义表示期望状态或结果的目标。指定可改变世界状态的动作。

2025-04-22 16:18:56 906

原创 天工Ultra:全球首个人形机器人半程马拉松冠军

人形机器人(Humanoid Robot)是一类模仿人类外形和行为的机器人,通常具备头部、躯干、双臂和双腿,能够执行类似人类的动作,如行走、抓取和交互。其设计目标是能够在人类构建的环境中自然行动,例如家庭、办公室或工厂,而无需对环境进行大幅改造。这种特性使得人形机器人在服务、工业和救援等领域具有广泛的应用潜力。昨日的马拉松赛事中,“天工Ultra”展现了人形机器人从实验室走向现实场景的能力,其成功完成21公里赛程的能力,预示着此类机器人未来可能在长时间、高强度任务中扮演重要角色。

2025-04-21 17:30:47 1332

原创 扫地机器人中的具身智能技术:从算法到硬件的全面解析

扫地机器人的历史可以追溯到上世纪90年代。1996年,Electrolux 推出了首款商用扫地机器人 Trilobite,它通过超声波传感器实现基本的避障功能。2002年,iRobot 公司推出的 Roomba 系列扫地机器人凭借高效的清洁能力和亲民的价格,迅速成为市场标杆。此后,随着传感器技术、计算能力和人工智能的进步,扫地机器人经历了从随机清扫到智能导航的转型。

2025-04-17 18:15:31 1986

原创 具身智能:下一个万亿市场的潜力

具身智能(Embodied Intelligence)是将人工智能(AI)与物理实体结合,使机器不仅能在数字世界中“思考”,还能在现实世界中“行动”的一种技术范式。从自动驾驶汽车到智能机器人助手,具身智能正在改变我们与技术的互动方式。随着技术的飞速发展,这一市场被认为有望成为下一个万亿级产业。根据国际数据公司(IDC)的预测,到2030年,具身智能市场规模可能达到1.5万亿美元,年复合增长率(CAGR)预计为25%。

2025-04-01 17:18:19 1036

原创 变分模型的关键:ELBO

第一课:ELBO和VAE

2025-03-27 15:23:52 471

原创 强化学习与双系统具身大模型的共舞

双系统VLA的概念在近期机器人研究中逐渐受到关注,例如一个双过程VLA:利用VLM实现高效机器人操控中提出的DP-VLA框架。该框架使用大型System 2模型进行复杂推理和决策,而小型System 1模型则处理实时运动控制和感官处理,旨在提高计算效率和实时性能。附件中的“GROOT N1:通用人形机器人开放基础模型”白皮书也描述了类似的双系统架构,System 2为视觉-语言模块,System 1为扩散变换器模块,用于生成实时动作。在。

2025-03-27 10:23:15 441

原创 具身智能大模型+RAG,Nature最新论文ELLMER

早就说过,AI Agent和具身智能Agent是2D与3D的一体两面。欲知后事如何,且看Nature最新论文。

2025-03-24 11:02:56 1398

原创 具身智能与强化学习 I: Model-Based RL

强化学习快速入门科普第一章

2025-03-24 10:30:34 1250

原创 英伟达开源首个人形机器人大脑

显卡寡头老大的下一步,瞄准了所有智能机械设备上的显卡。

2025-03-20 12:34:25 813

原创 AI代理到底怎么玩?

当前AI Agent和RAG(检索增强生成)最流行的架构包括基础RAG、代理式RAG路由、查询规划代理式RAG等,研究表明这些架构在提升AI性能方面效果显著。代理式RAG架构允许AI根据查询动态选择工具或数据源,证据倾向于其在复杂任务中表现优异。本文每个讨论到的架构都有代码示例,适合快速入门,帮助理解实际实现。

2025-03-18 10:22:09 1966

原创 宇树机器人丝滑的二人转动作背后,MPC到底是什么?

了解MPC,让我们闻“机”起舞。

2025-03-17 14:17:44 1284

原创 一文读懂啥是GRPO

Group Relative Policy Optimization(GRPO)是一种新型的强化学习算法,由DeepSeek提出,旨在提升大语言模型(LLMs)在推理任务中的表现。它基于近端策略优化(PPO)框架进行改进,通过独特的奖励机制和策略更新方式,使模型在训练过程中能够更有效地学习和优化策略,从而增强模型的推理能力和性能。与传统的强化学习算法不同,GRPO在训练过程中摒弃了价值网络,采用组采样的方式进行优势估计,大大降低了训练成本和计算复杂度。数学原理。

2025-03-17 09:49:54 2365

原创 Java:孩子们,Python不是AI编程的全部

AI时代,Java并没有退场。

2025-03-15 10:47:19 980

原创 中国2025,人形机器人元年只是开胃菜

2025年,中国在国际舞台上的表现可谓是“高光时刻”。经济稳健、科技领先、外交主动、军事强大、文化影响力不断提升,中国正在以更加自信的姿态参与全球治理,推动构建人类命运共同体。当然,挑战依然存在,比如中美关系的复杂性、地缘政治的风险等。但正如那句老话所说:“困难像弹簧,你弱它就强。”中国显然已经准备好了迎接这些挑战,并以更加开放的姿态与世界共享发展机遇。

2025-03-14 12:02:18 565

原创 混合专家模型:DeepSeek的中流砥柱,具身智能的他山之石

MoE是DeepSeek劈开算力壁垒的盘古巨斧,会成为具身领域的他山之石吗?

2025-03-14 10:12:13 792

原创 DeepSeek:具身智能的高层级大脑

DeepSeek赋能一切,当然也包括具身智能。

2025-03-13 09:20:58 1220

原创 Agent Magma:论AI智能体在网络世界和现实世界的阴阳调和

AI Agent和具身智能其实是同一赛道

2025-03-12 11:48:09 863

原创 Rich Sutton的一般价值函数与选择模型基本教程

为了克服传统价值函数的局限性,Rich Sutton提出了一般价值函数(General Value Functions, GVFs)的概念。GVFs扩展了传统价值函数的定义,使其能够预测各种不同的信号,而不仅仅是环境奖励。伪奖励函数(Cumulant):替代了传统的奖励函数,可以是环境中的任何可测量信号,如传感器读数、与特定对象的距离等。伪终止函数(Pseudo-termination):定义了预测的时间范围,可以是基于状态的函数,而不仅仅是固定的折扣因子。策略(Policy)

2025-03-11 17:28:23 426

原创 Rich Sutton的最新倡议:重新思考AI的未来方向

在深度学习之父获得诺奖之后,本世纪除了深度学习之外的又一AI硕果和它的缔造者,强化学习之父再次被推上了风口浪尖,为我们带来了“苦涩的教训2.0”。

2025-03-11 16:55:06 802

原创 灵犀X2:人形机器人的新篇章

灵犀X2是智元机器人推出的最新款人形机器人,很可能是其前代产品灵犀X1的升级版本。灵犀X1作为一款开源的模块化机器人,其机械设计和软件代码完全公开,全球开发者都可以参与优化和创新。这款机器人身高130厘米,体重33公斤,具备34到44个自由度(Degrees of Freedom, DoF,即关节活动范围),能够执行轻型任务,如端茶送水、整理房间等。灵犀X2在继承这些特性的基础上,可能进一步提升了动作灵活性和AI智能水平。潜动作预测模型(VLLA)和情感计算,并分析其对人形机器人发展的影响。

2025-03-11 11:51:20 1463

原创 当前人工智能系统对人类智能建模的颗粒度分析

博主笃信人工智能的下一次突破仍在对于人类智能体系的挖掘与细粒度建模中,本文十一点对于当前人工智能发展与其蓝本人类智能的粒度比较与疏理。欢迎各位留言讨论。内容摘要:认知架构是对人类思维结构的理论模型,也是这种心灵结构理论在人工智能和计算认知科学领域中的计算实现。从本质上讲,认知架构试图回答"一个智能体是如何思考的"这个核心问题,为构建人类水平的人工智能提供理论基础和实践路径。

2025-03-10 17:55:49 747

原创 具身智能与人形机器人发展综合指南

具身智能(Embodied AI)是人工智能发展的一个重要分支,指的是一种基于物理身体进行感知和行动的智能系统,其通过智能体与环境的交互获取信息、理解问题、做出决策并实现行动,从而产生智能行为和适应性。具身智能的核心在于"身体力行",而非"纸上谈兵"。正如李飞飞教授所说:“具身的含义不是身体本身,而是与环境交互以及在环境中做事的整体需求和功能。具身智能与非具身智能的根本区别在于:非具身智能(如传统的互联网AI)主要从精心制作的数据集中学习,进行数据到标签的映射,无法在真实世界进行体验学习和产生影响;

2025-03-10 10:51:20 1875 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除