- 博客(24)
- 收藏
- 关注
原创 具身智能:千金难买数据贵,DemoGen一条抵万金
DemoGen技术通过全合成演示生成框架,实现机器人从单次人类演示中"举一反三"。其核心利用任务与运动规划(TAMP)和3D点云编辑,将演示分解为运动段和技能段,通过算法生成适应不同位置的虚拟数据。实验显示,仅需1次演示生成的100-200条合成数据,即可达到25次人类演示的效果(成功率88%),降低20倍数据采集成本。该技术支持单/双臂操作,在抓取、搬运等任务中展现出色泛化能力,且生成速度达0.01秒/轨迹。尽管存在视觉失配等局限,DemoGen为智能制造、家庭服务等领域提供了高效的机器人学习方案。
2025-05-29 16:06:40
845
原创 仓颉造字,亦可造AI代理
CangjieMagic是一个突破性的LLM Agent开发平台,基于仓颉编程语言构建。作为首款此类平台,它引入了新颖的Agent DSL(领域特定语言)架构、原生支持MCP(可能是“Magic Communication Protocol”)通信协议,以及高级智能规划功能。CangjieMagic于2025年3月开源,标志着智能Agent开发领域的一次重大飞跃,为开发者提供了一个强大而灵活的框架,用于创建复杂的AI驱动应用。定义表示期望状态或结果的目标。指定可改变世界状态的动作。
2025-04-22 16:18:56
906
原创 天工Ultra:全球首个人形机器人半程马拉松冠军
人形机器人(Humanoid Robot)是一类模仿人类外形和行为的机器人,通常具备头部、躯干、双臂和双腿,能够执行类似人类的动作,如行走、抓取和交互。其设计目标是能够在人类构建的环境中自然行动,例如家庭、办公室或工厂,而无需对环境进行大幅改造。这种特性使得人形机器人在服务、工业和救援等领域具有广泛的应用潜力。昨日的马拉松赛事中,“天工Ultra”展现了人形机器人从实验室走向现实场景的能力,其成功完成21公里赛程的能力,预示着此类机器人未来可能在长时间、高强度任务中扮演重要角色。
2025-04-21 17:30:47
1332
原创 扫地机器人中的具身智能技术:从算法到硬件的全面解析
扫地机器人的历史可以追溯到上世纪90年代。1996年,Electrolux 推出了首款商用扫地机器人 Trilobite,它通过超声波传感器实现基本的避障功能。2002年,iRobot 公司推出的 Roomba 系列扫地机器人凭借高效的清洁能力和亲民的价格,迅速成为市场标杆。此后,随着传感器技术、计算能力和人工智能的进步,扫地机器人经历了从随机清扫到智能导航的转型。
2025-04-17 18:15:31
1986
原创 具身智能:下一个万亿市场的潜力
具身智能(Embodied Intelligence)是将人工智能(AI)与物理实体结合,使机器不仅能在数字世界中“思考”,还能在现实世界中“行动”的一种技术范式。从自动驾驶汽车到智能机器人助手,具身智能正在改变我们与技术的互动方式。随着技术的飞速发展,这一市场被认为有望成为下一个万亿级产业。根据国际数据公司(IDC)的预测,到2030年,具身智能市场规模可能达到1.5万亿美元,年复合增长率(CAGR)预计为25%。
2025-04-01 17:18:19
1036
原创 强化学习与双系统具身大模型的共舞
双系统VLA的概念在近期机器人研究中逐渐受到关注,例如一个双过程VLA:利用VLM实现高效机器人操控中提出的DP-VLA框架。该框架使用大型System 2模型进行复杂推理和决策,而小型System 1模型则处理实时运动控制和感官处理,旨在提高计算效率和实时性能。附件中的“GROOT N1:通用人形机器人开放基础模型”白皮书也描述了类似的双系统架构,System 2为视觉-语言模块,System 1为扩散变换器模块,用于生成实时动作。在。
2025-03-27 10:23:15
441
原创 具身智能大模型+RAG,Nature最新论文ELLMER
早就说过,AI Agent和具身智能Agent是2D与3D的一体两面。欲知后事如何,且看Nature最新论文。
2025-03-24 11:02:56
1398
原创 AI代理到底怎么玩?
当前AI Agent和RAG(检索增强生成)最流行的架构包括基础RAG、代理式RAG路由、查询规划代理式RAG等,研究表明这些架构在提升AI性能方面效果显著。代理式RAG架构允许AI根据查询动态选择工具或数据源,证据倾向于其在复杂任务中表现优异。本文每个讨论到的架构都有代码示例,适合快速入门,帮助理解实际实现。
2025-03-18 10:22:09
1966
原创 一文读懂啥是GRPO
Group Relative Policy Optimization(GRPO)是一种新型的强化学习算法,由DeepSeek提出,旨在提升大语言模型(LLMs)在推理任务中的表现。它基于近端策略优化(PPO)框架进行改进,通过独特的奖励机制和策略更新方式,使模型在训练过程中能够更有效地学习和优化策略,从而增强模型的推理能力和性能。与传统的强化学习算法不同,GRPO在训练过程中摒弃了价值网络,采用组采样的方式进行优势估计,大大降低了训练成本和计算复杂度。数学原理。
2025-03-17 09:49:54
2365
原创 中国2025,人形机器人元年只是开胃菜
2025年,中国在国际舞台上的表现可谓是“高光时刻”。经济稳健、科技领先、外交主动、军事强大、文化影响力不断提升,中国正在以更加自信的姿态参与全球治理,推动构建人类命运共同体。当然,挑战依然存在,比如中美关系的复杂性、地缘政治的风险等。但正如那句老话所说:“困难像弹簧,你弱它就强。”中国显然已经准备好了迎接这些挑战,并以更加开放的姿态与世界共享发展机遇。
2025-03-14 12:02:18
565
原创 Rich Sutton的一般价值函数与选择模型基本教程
为了克服传统价值函数的局限性,Rich Sutton提出了一般价值函数(General Value Functions, GVFs)的概念。GVFs扩展了传统价值函数的定义,使其能够预测各种不同的信号,而不仅仅是环境奖励。伪奖励函数(Cumulant):替代了传统的奖励函数,可以是环境中的任何可测量信号,如传感器读数、与特定对象的距离等。伪终止函数(Pseudo-termination):定义了预测的时间范围,可以是基于状态的函数,而不仅仅是固定的折扣因子。策略(Policy)
2025-03-11 17:28:23
426
原创 Rich Sutton的最新倡议:重新思考AI的未来方向
在深度学习之父获得诺奖之后,本世纪除了深度学习之外的又一AI硕果和它的缔造者,强化学习之父再次被推上了风口浪尖,为我们带来了“苦涩的教训2.0”。
2025-03-11 16:55:06
802
原创 灵犀X2:人形机器人的新篇章
灵犀X2是智元机器人推出的最新款人形机器人,很可能是其前代产品灵犀X1的升级版本。灵犀X1作为一款开源的模块化机器人,其机械设计和软件代码完全公开,全球开发者都可以参与优化和创新。这款机器人身高130厘米,体重33公斤,具备34到44个自由度(Degrees of Freedom, DoF,即关节活动范围),能够执行轻型任务,如端茶送水、整理房间等。灵犀X2在继承这些特性的基础上,可能进一步提升了动作灵活性和AI智能水平。潜动作预测模型(VLLA)和情感计算,并分析其对人形机器人发展的影响。
2025-03-11 11:51:20
1463
原创 当前人工智能系统对人类智能建模的颗粒度分析
博主笃信人工智能的下一次突破仍在对于人类智能体系的挖掘与细粒度建模中,本文十一点对于当前人工智能发展与其蓝本人类智能的粒度比较与疏理。欢迎各位留言讨论。内容摘要:认知架构是对人类思维结构的理论模型,也是这种心灵结构理论在人工智能和计算认知科学领域中的计算实现。从本质上讲,认知架构试图回答"一个智能体是如何思考的"这个核心问题,为构建人类水平的人工智能提供理论基础和实践路径。
2025-03-10 17:55:49
747
原创 具身智能与人形机器人发展综合指南
具身智能(Embodied AI)是人工智能发展的一个重要分支,指的是一种基于物理身体进行感知和行动的智能系统,其通过智能体与环境的交互获取信息、理解问题、做出决策并实现行动,从而产生智能行为和适应性。具身智能的核心在于"身体力行",而非"纸上谈兵"。正如李飞飞教授所说:“具身的含义不是身体本身,而是与环境交互以及在环境中做事的整体需求和功能。具身智能与非具身智能的根本区别在于:非具身智能(如传统的互联网AI)主要从精心制作的数据集中学习,进行数据到标签的映射,无法在真实世界进行体验学习和产生影响;
2025-03-10 10:51:20
1875
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人