自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(812)
  • 收藏
  • 关注

原创 面向柔性制造的具身智能综述

摘要: 随着大模型技术突破,具身智能加速向工业制造渗透。工业场景半结构化、工艺标准化等特征为具身智能提供落地优势,但柔性制造转型带来三大核心挑战:1)受限感知下的工艺精准建模与在线监测;2)柔性适配与高精操控的动态平衡;3)通用技能与专用工艺协同融合。本文提出“工业之眼(感知层)-工业之手(控制层)-工业之脑(决策层)”三层技术框架,系统综述3D成像、多模态融合、自适应控制、数字孪生等关键技术,结合汽车、航空等案例验证落地效果,并构建“认知增强-技能跃迁-系统进化”三阶段演进模型,指出数据、仿真、安全等现存

2026-07-03 11:09:45 144

原创 Nature Sensor | 把显微镜“戴”在手腕上:首次在运动中拍到单个汗腺如何“喷汗”

加州大学伯克利分校团队开发出新型可穿戴光学-电皮肤传感平台,首次在运动状态下直接观测到汗腺的"爆发式"分泌过程。研究发现汗腺并非持续渗汗,而是周期性喷发;当身体需要更多散热时,先通过增加腺体爆发频率(上限约7次/分钟)应对,频率饱和后再通过增大单次爆发量满足需求,形成双模式调控机制。这项技术突破为汗液生理学研究提供了全新工具,有望应用于热应激评估和汗液相关疾病诊断。研究成果发表于《Nature Sensor》。

2026-07-01 13:24:45 191

原创 北大×NVIDIA让机器人世界模型有了“物理感”:视频生成登顶,闭环规划成功率提升50%

PhysisForcing提出了一种强化机器人视频生成物理合理性的训练框架,通过聚焦关键区域(如机械臂、物体接触点)施加双重监督:轨迹连续性确保局部运动连贯,语义关系一致性维持全局互动逻辑。该方法兼容多种视频扩散模型,在R-Bench等基准上将生成质量提升9-22%,作为世界模型使机器人动作规划成功率从16%提升至24%。核心创新在于将物理约束转化为可训练的像素级轨迹对齐和语义级关系对齐,无需修改模型架构或增加推理成本,显著减少物体穿模、接触断裂等影响决策的关键错误。实验表明,这种针对性监督比全局优化更有效

2026-06-30 20:55:02 257

原创 Nature Sensors | 自供能模拟神经形态系统,用于多模态感测、编码和学习,具备扩散和漂移忆阻

Nature Sensors最新研究提出了一种颠覆性的自供能模拟神经形态传感系统。该系统通过扩散型忆阻器直接将光、压力等模拟信号编码为脉冲时间,利用漂移型忆阻器实现无监督学习,将感知、编码和融合功能前移至传感器端。相比传统需要ADC转换和数字处理的方案,这种模拟系统显著降低了功耗和延迟,使传感器具备初级智能处理能力。研究团队通过雷击定位和人体动作识别演示验证了该技术的可行性,为边缘智能设备的低功耗传感处理提供了新思路,有望推动电网监测、可穿戴设备等领域的传感系统革新。

2026-06-29 09:15:26 512

原创 Nature Communications | SkinSight:把高像素相机阵列贴到皮肤上,让手掌变成“透视眼”

清华大学团队在《Nature Communications》发表研究成果,开发出一种名为SkinSight的贴肤成像系统。该系统将高像素微型CMOS相机嵌入柔性基底,可像创可贴一样贴合皮肤,实现动态形变下的稳定成像。通过刚柔混合架构(刚性成像节点+柔性互连导线)和自适应三维重建算法,解决了传统相机阵列无法兼顾高分辨率与可拉伸性的难题。实验显示,该系统在500次形变循环后仍保持稳定性能,三维重建误差仅1.52%。这种"皮肤相机"可应用于狭窄空间探测、增强现实等领域,重新定义了人机视觉交互方

2026-06-28 18:21:21 275

原创 DF-ExpEnse:让扩散策略学会「聪明地探索」,机器人微调样本效率大幅提升

摘要: 斯坦福团队提出DF-ExpEnse(ICML 2026),一种提升预训练扩散策略在线微调效率的技术。针对强化学习微调中在线交互成本高的问题,该方法利用扩散模型的多模态特性生成候选动作,通过集成批评家网络评估动作的探索价值(平衡质量与不确定性),并引入BC-SR机制防止策略遗忘预训练知识。实验表明,DF-ExpEnse在机器人操纵、运动控制等任务中显著提升样本效率,且兼容不同微调框架。其核心创新在于将探索优化前置到数据收集阶段,以轻量级设计(默认仅3候选动作+5批评家)实现高效探索。多机器人场景下的集

2026-06-27 15:39:24 355

原创 Nature Communications | 给机器人装上“电子指纹”:0.85°方向精度,滑移不再“测不准”

浙江大学汪延成教授团队受向日葵种子排列启发,在《自然·通讯》发表创新成果:一款基于费马螺旋排列的“电子指纹”触觉传感器,突破机器人滑移感知瓶颈。该传感器采用三层仿生结构,144个触觉像素以黄金分割比0.618的螺旋排布实现各向同性感知,将滑移方向精度提升至0.85°,位移分辨率达0.091毫米,并实现力-滑移机械解耦。实验显示其能实时检测物体滑动,触发自适应抓取力调整,还可用于远程精细操作。这项硬件创新为机器人灵巧操作提供了接近人类皮肤触觉的感知能力。

2026-06-26 09:59:13 197

原创 FTP-1:首个跨触觉传感器与机器人本体的通用基础触觉策略

摘要:FTP-1(Foundation Tactile Policy)是首个面向接触密集型操作的通用基础触觉策略,旨在解决触觉传感器异构性导致的策略迁移难题。通过提出Morphology-Aware Tactile Token Space(MTTS),将图像型、阵列型、状态型等异构触觉信号统一映射为功能区域组织的触觉token,结合共享触觉Transformer实现跨硬件迁移。在3000小时大规模异构数据(涵盖21种传感器)预训练后,FTP-1在已见传感器任务上成功率提升17.2%,在未见传感器(如Xens

2026-06-25 10:47:15 224

原创 UC Berkeley、NVIDIA 及 Stanford 联合团队--机器人的“盲盒”开到头了:T-Rex 赋予机器人真实“手感”

UC伯克利、英伟达和斯坦福联合团队发布T-Rex框架,突破机器人触觉感知瓶颈。该研究通过拆解22类基础动作原语,构建包含100小时触觉同步数据的训练集,并创新设计时空触觉编码器将高频力学信号压缩为语义化特征。采用三专家异步架构实现视觉规划与触觉精调的解耦,在12项精细操作任务中成功率提升至65%,较基线模型提升近一倍。实验证明视觉预训练与触觉中期训练的协同效应,为具身智能发展指明"视觉思考+触觉微调"的新范式,推动机器人向更拟人化的灵巧操作迈进。

2026-06-24 10:57:09 210

原创 Science Robotics | 当微型机器人“活了”:藻类引擎的临床突围与四大瓶颈

生物混合微型机器人:从实验室到临床的转化挑战 生物混合微型机器人利用微生物(如藻类)作为动力,实现体内精准药物递送,在肺部感染和肠道炎症等动物模型中展现出显著疗效。然而,其临床转化面临四大瓶颈:监管路径不明确(需明确归类为组合产品),规模化生产难题(需开发连续、封闭的纯化工艺),灭菌困境(需全流程无菌制造),以及保质期短(需优化低温或固定化保存方案)。尽管挑战严峻,但细胞治疗和生物制药的现有技术可提供借鉴。未来需跨学科协作,以工程化思维解决生命系统的复杂性,推动这一新兴疗法走向临床。 (来源:Science

2026-06-23 09:47:48 227

原创 Science 正刊--这株野草教会了机器人如何“温柔地捏”:紫堇种荚的物理智慧

《科学》杂志研究揭示紫堇种荚的"物理智能":一种无需电子控制的精密驱动机制。韩国科研团队发现紫堇种荚通过独特的半圆形瓣片结构和三维曲面设计,实现了40%的高效能量转化和精确的时序控制弹射。这种"几何编码智能"机制仅凭材料形变就能完成感知-决策-执行闭环,比传统爆炸式弹射效率提升40倍。受此启发,团队开发出能在5秒内自主闭合伤口、切割肿瘤的仿生驱动器,为无电源微创手术工具和软体机器人提供了新范式。研究表明,生物进化出的物理计算方案或将成为下一代自主医疗设备的设计蓝本。

2026-06-22 09:55:13 202

原创 机器人需要的不是更大的模型,而是读懂物理世界的能力

斯坦福等机构研究者挑战当前具身智能主流范式,指出通用机器人发展的核心瓶颈并非模型规模不足,而是缺乏将物理经验转化为机器人可理解信号的机制。论文批判了当前三大主流方法:机器人原生监督(数据获取成本过高)、视频弱监督(无法直接转化为动作指令)和仿真世界模型(忽略关键物理变量)。作者提出四个关键突破方向:1)物理数据引擎与具身自动标注;2)跨具身任务保留重定向;3)物理扎根的世界模型;4)自我改进的部署循环。该研究特别适用于工业制造、家庭服务和特种作业领域,强调机器人应从"物理世界原始经验"中

2026-06-21 15:00:32 213

原创 Qwen-RobotManip:当“对齐“成为机器人大模型的通用翻译器

对齐是规模化的前提:Qwen-RobotManip 证明,在机器人操作领域,数据对齐比数据堆量更关键。三维对齐框架(表示、运动、行为)让异构数据从互相冲突变成互相增强。开源数据足够用:38,100 小时的纯开源预训练语料,加上人机协同合成管线,实现了对使用私有数据的竞争对手的全面超越。OOD 才是真实力:在 RoboChallenge 排名第一(相对提升 20%),六个分布外测试集全面领先 pi-0.5,零样本泛化能力已从"有趣的涌现"变成"可复现的工程指标"。一个模型,四种机器人。

2026-06-20 15:30:57 275

原创 拧个瓶盖就暴露了机器人的“通病”:不是手笨,是缺这种预判能力

摘要:最新研究《TacForeSight》提出突破性机器人触觉预判方案,通过力觉信号预测接触状态,显著提升精细操作能力。该系统采用"力觉先导-触觉跟进"的双阶段架构,其中轻量级世界模型(11.8M参数)利用120Hz力传感器数据预测后续触觉反馈,结合交叉注意力机制和自适应门控,使机器人在接触前就能调整动作。实验显示,在拧瓶盖等5项接触密集型任务中,其扰动场景成功率高达87%,远超传统视觉主导方法(0%-33%)。研究揭示了高频力信号对触觉预测的关键作用,为具身智能提供了从"被动

2026-06-19 14:50:14 353

原创 Nature Electronics 一种用于多模态皮肤信号监测的柔性触觉接口

摘要:密歇根大学等机构的研究团队在UIST2025上发表了名为EI-Lite的技术,通过手腕上仅4个电极的电阻抗传感,实现了96.33%的微手势识别准确率和连续捏力估计。该技术解决了传统方案(如肌电信号EMG)在精细动作识别上的不足,为智能手表交互和肌电假肢手控制提供了新思路。EI-Lite通过优化电极布局(手腕上下侧)、提升采样率至100Hz和改进信号处理,显著降低了硬件复杂度。其潜在应用包括与EMG互补的假肢控制系统,实现更自然的力度反馈和精细操作,但仍需解决截肢者验证、动态鲁棒性等临床挑战。这项研究标

2026-06-18 10:11:10 237

原创 Nature Sensor | 把“光谱仪”塞进芯片:解码光谱不再需要计算机,传感器自己就够了

《自然·传感器》最新研究突破传统光谱仪局限,首次实现"传感器内光谱传感"。科学家利用特殊锑-硫-硒光电二极管,通过电压调控构建出可编程的光谱分拣器,将计算功能直接嵌入传感器硬件。这种创新架构使传感器在采集光信号时同步完成解码,无需外部计算支持,0.12秒内即可完成墨水真伪识别等任务。相比传统方案,该技术实现数据压缩比97.5%、延迟降低91%、能耗减少89.4%,为便携式实时物质分析设备开辟了新路径。这项突破重新定义了光谱传感器概念,使光谱分析从实验室走向各类现场检测场景成为可能。

2026-06-17 08:45:53 176

原创 Science Robotics封面|从球到车:一台228克“掌中宝”如何改写月球探索规则

摘要:日本JAXA开发的微型月球车SORA-Q(重228克)通过创新设计实现自主探测。其偏心轮结构和玩具式变形机构克服了月球松软地形的挑战,自主算法从240次拍摄中精选2-3张照片传回地球。该任务采用敏捷开发模式,仅3年完成研制,成本大幅降低。2024年1月成功在月面运行108分钟,验证了分布式探测的可行性。研究发表于《Science Robotics》2026年6月刊,为未来低成本、高鲁棒性的微型机器人编队行星探索提供了技术范本。(149字) 核心亮点: 极简设计:仅2台电机实现变形/行驶,偏心轮结构防陷

2026-06-16 09:57:03 208

原创 Nature Communications|当注意力锁定手指,手腕的感觉为什么会突然变“模糊”

韩国研究团队在《自然·通讯》发表论文,揭示了注意力对大脑初级体感皮层(S1)的分层调控机制。通过7T高场磁共振技术,研究发现当注意力集中于手指时,S1皮层呈现"浅层增强、深层抑制"的分层响应模式;而对被忽略的手腕刺激,则表现为跨层整体抑制。这种调控在疼痛干扰下依然稳定存在,行为实验也证实注意力会显著降低对非目标区域的触觉定位能力。研究表明注意力并非简单增强目标信号,而是在皮层不同层级实施差异化的门控策略:对重要信息进行精细调控,对无关输入则进行早期过滤。该研究为理解注意力的神经机制提供了

2026-06-15 10:13:37 354

原创 Nature正刊:谷歌最新研究成果,扔掉手环,手机前置摄像头就能无感监测心率了

谷歌团队开发了PHRM系统,利用手机前置摄像头实现无感心率监测。该系统通过远程光电容积脉搏波技术,在用户日常使用手机时捕捉面部微弱的肤色变化,无需额外设备即可达到医疗级精度。核心创新包括:将心率估计转为多分类任务以提高抗干扰能力;解决光学心率监测在深肤色人群中的精度问题;通过统计分析从瞬时数据提取每日静息心率。验证显示其误差小于5bpm,且覆盖所有肤色类型。这项技术使健康监测更普及,但剧烈运动场景和隐私问题仍需解决。研究标志着心率监测向"被动、无感"方向的重要进展。

2026-06-13 18:20:41 209

原创 Nature正刊:用神经网络替代有限元仿真,热电设计提速四个数量级

日本NIMS和筑波大学团队在《Nature》发表研究,开发出TEGNet神经网络,能在0.25秒内完成传统有限元仿真2237秒的热电器件性能预测,精度超99%。该技术突破热电设计瓶颈,通过模块化组合快速优化器件结构,成功研制出效率达9.3%和8.7%的领先器件,将AI应用从材料筛选推进到器件设计层面,实现"慢仿真"到"快推理"的范式转变,为复杂系统设计提供新思路。

2026-06-12 11:19:02 319

原创 机器人实时操作真被它搞定了!这个VLA模型在芯片上跑出11.69Hz

【论文摘要】RhinoVLA通过系统性优化在机器人视觉-语言-动作(VLA)任务中实现高效部署。研究发现传统VLM模型的延迟瓶颈主要来自MLP投影算子而非注意力机制,通过采用视觉词元更高效的Qwen3-VL架构(压缩75%词元)、设计72D统一动作槽空间和InstanceLoRA适配机制,在保持多模态能力的同时显著提升推理速度。在Huixi R1芯片上实现11.69Hz实时推理(较基线提升10倍),并在跨机器人操作任务中验证了泛化性能。该工作揭示了模型轻量化应从实际部署瓶颈出发,通过算法-硬件协同设计实现性

2026-06-11 13:20:29 200

原创 ICRA 2026深度观察:全栈闭环成标配,中国具身智能势力显著崛起

ICRA2026技术趋势与学术争鸣摘要 ICRA2026展现了具身智能领域的三大产业趋势:全栈闭环成为生存前提,企业纷纷布局“模型+硬件+数据”完整链条;数据采集跃居竞争核心,采集方式决定模型上限;灵巧手加速逼近人手性能,触觉集成成标配。 学术层面,UC Berkeley教授Ken Goldberg挑战“数据万能论”,指出机器人数据积累与人类操作存在“十万年鸿沟”,并提出融合Model-Based与Model-Free的**“图即策略”(GAP)**方案——通过大模型生成可验证的计算图,结合工程化调试,显著

2026-06-10 10:17:24 967

原创 Nature Communications|同一个触觉刺激,为什么有时该舔、有时不该舔?前额叶给感觉加了一道“情境门”

瑞士洛桑联邦理工学院研究发现,小鼠前额叶皮层中的wM2脑区在情境依赖决策中起关键作用。研究通过光遗传学和多脑区记录技术,揭示wM2能整合声音线索和胡须触觉信息,在毫秒级时间窗内决定是否触发舔水动作。声音情境首先在wM2形成持续神经状态,随后胡须刺激到来时,wM2最早(约20毫秒)表现出情境依赖性反应,并在30毫秒内预测行为选择。该研究阐明了大脑如何根据情境灵活调控感觉-动作转换的神经机制,为理解认知控制提供了新视角。

2026-06-09 11:04:34 193

原创 MiTaS 多分辨率触觉感知:当机器人学会用“指尖“思考,操作成功率从 31% 飙升到 80%

摘要:达姆施塔特工业大学团队提出多分辨率触觉模仿学习框架MiTaS,创新性地将低频视觉触觉传感器(GelSight)与高频事件触觉传感器(Evetac)融合,通过模态专用卷积主干和Transformer架构实现异构传感器数据的高效整合。该系统在齿轮组装、钥匙插锁等高遮挡接触任务中取得80%平均成功率,较纯视觉方案提升2.6倍。研究发现模型能自发形成"感官切换"策略:远距离依赖视觉,接触瞬间响应高频触觉,精细操作时侧重空间触觉形变。协同训练方案使模型在部署时即使移除高频传感器仍保持性能优势

2026-06-08 10:51:02 264

原创 ICRA 2026 北邮本科生一作提出TransTac传感器-透明触觉+视觉融合!

北京邮电大学DeepTouch课题组在ICRA2026发表的研究提出了一种革命性的视触觉传感器TransTac,通过紫外编码透明弹性体技术,首次实现了机器人近接触区域的视觉观测与触觉感知同步。该传感器采用双目立体匹配和RGB-D融合技术,在物体距离小于9cm时仍能保持2.44mm的深度测量精度,有效填补了传统RGB-D相机的感知盲区。实验显示,TransTac采集的触觉图像能被视觉语言模型以83.3%的准确率识别,显著优于传统触觉传感器。这项突破为机器人精细操作提供了连续可靠的近场感知能力。

2026-06-07 15:11:23 263

原创 WLA:当机器人同时学会“看世界“和“说人话“,具身智能迎来统一范式

上海交通大学YiYang团队提出具身智能基础模型WLA(World-Language-Action),首次将世界建模、语言推理和动作生成统一到单一自回归Transformer中。该模型通过双专家机制(世界专家+动作专家)实现物理理解到动作决策的端到端融合,创新性地采用元查询机制支持速度与精度的动态权衡。仅20亿参数的WLA-0原型在RoboTwin2.0Clean基准上取得92.94%成功率,延迟低至40毫秒,并展现出从无标注跨具身视频学习的潜力。这一突破标志着机器人智能从模块化拼装向统一认知架构的重要跨越

2026-06-06 11:18:22 485

原创 智源&清华合作成果登上Science:脑科学多模态基础模型Brainμ支撑揭示“记忆-睡眠”调控的神经机制

北京智源研究院与清华大学合作在《科学》发表研究,揭示记忆重激活可调控睡眠动态,提出"记忆-睡眠"双向作用新机制。研究利用智源自研的神经科学多模态基础模型Brainμ0,实现了跨模态神经信号分析与睡眠状态识别,验证了负/正记忆激活分别会加剧/改善睡眠质量。该模型已在多个实验室应用,支持跨物种、跨模态数据分析,展现了AI辅助神经科学研究的潜力。成果不仅为理解睡眠调控提供新视角,也为精神疾病相关睡眠障碍提供了新思路。

2026-06-05 13:12:50 273

原创 触觉的中间道路:压力中心表示如何打通灵巧操作的Sim-to-Real鸿沟

摘要: 苏黎世联邦理工学院(ETH Zurich)与加州大学伯克利分校(UC Berkeley)的研究团队提出了一种基于物理的压力中心(Center-of-Pressure, CoP)触觉表示法,解决了机器人触觉Sim-to-Real迁移的难题。CoP将高密度触觉数据压缩为合力向量和等效接触点,既保留了力学信息,又对仿真偏差具有鲁棒性。该方法通过可微分应力分布模型和无需真值传感器的自校准技术,实现了多指灵巧手的零样本迁移。实验表明,在无视觉的插拔和球平衡任务中,CoP策略的成功率显著优于二值接触等基线方法,

2026-06-04 16:49:31 269

原创 AHEAD:给冻结的VLA装上“预判未来“的眼睛,动态抓取成功率从0%飙升到97%

2026-06-03 19:02:24 194

原创 Science Robotics | 颠覆百年仿生传统:这只“海胆”证明了,机器人不该有前后之分

颠覆性突破:动态对称性理论重塑机器人设计范式 杜克大学团队在《Science Robotics》发表研究,提出"动态对称性"理论,挑战了机器人设计百年来的仿生传统。该理论指出,机器人性能的关键不在于形态对称,而在于所有运动方向的能力均衡性。基于此,团队开发了20腿球形机器人Argus,其动态对称性评分高达0.91(传统机器人普遍低于0.6),展现出全地形全向移动、瞬时自稳定、高容错(断3腿仍运行)等突破性能力,甚至在模拟月球重力下实现墙壁攀爬。这项研究不仅创造了新形态机器人,更建立了量化

2026-06-02 15:51:09 238

原创 手术机器人登上Science Robotics:2毫米纤细手臂,从3厘米切口完成腰椎神经减压

四川大学华西医院研发的MicroSpine机器人系统突破性地解决了腰椎手术微创与彻底减压的矛盾。该系统采用三根直径仅2毫米的机械臂,通过3厘米小切口进入椎间盘间隙,15分钟内完成传统需大切口才能实现的神经减压。创新设计包括榫卯互锁结构增强刚度、铥激光多参数切割及生理盐水循环系统。在3D模型、动物及人体标本实验中,成功抵达传统前路手术无法处理的脊椎后方病灶。相比传统手术,该系统兼具微创优势(出血约5ml)与彻底减压能力,有望为高龄高危患者带来革命性治疗选择。研究发表于《Science Robotics》。

2026-06-02 15:49:37 288

原创 Science正刊|为什么大脑能“改规则”?答案可能藏在运动皮层神经元的树突顶端

来自(NeuroCure Cluster of Excellence, Charité – Universitätsmedizin Berlin)以及(Biology Department, Emory University)等团队,在发表了题为的研究。这项工作把答案指向了小鼠前额运动相关区域中 5 层锥体神经元的。这些神经元不是简单把输入加起来再放电,而是有一个很长的树突结构,伸到皮层第 1 层,那里可以接收来自感觉区、丘脑等多个来源的输入。

2026-05-29 10:29:53 297

原创 Science Robotics | 不靠大脑靠身体:这群机器人靠“纠缠”就能成群结队地运动

《Science Robotics》最新研究揭示了一种革命性的机器人协作模式:通过物理纠缠实现群体智能。佐治亚理工学院和康奈尔大学团队开发的"三体"模块机器人仅重25克,通过魔术贴弱连接和单一自由度运动,展现出惊人的自组织能力。这些机器人能自发形成高效S形链条,遇到障碍时像液体般流动分离,故障时自动重组。研究证明,机械智能无需复杂算法,仅靠形态设计和物理交互就能实现稳定、适应性强的群体行为。这种"优雅降级"的特性为未来微纳尺度机器人系统提供了新思路,挑战了传统依赖精密

2026-05-28 14:33:14 360

原创 Science Robotics 人形机器人将在25年内取代大多数人类工人——真还是假?

2025年10月22日,中国杭州,IEEE/RSJ国际机器人与系统会议(IROS)现场。开场投票:80%的人认为——辩论前80%反对、辩论后90%反对——这场辩论不但没有制造分裂,反而让原本持怀疑态度的多数派更加坚定了立场。三个月后,这场辩论的完整记录以论文形式发表在《Science Robotics》上(2026年5月20日,第11卷第114期),正式进入学术文献。反方票数越辩越多——这在辩论史上极为罕见。它意味着,当正反双方把所有论据摊在桌面上之后,那些原本可能动摇的中间派,几乎全部倒向了同一个结论。

2026-05-27 14:06:50 459

原创 给机器人一双能“摸”的手:触觉、规模化与具身智能的数据革命

摘要:2026年,具身智能领域迎来触觉数据革命。OPENTOUCH项目首次实现全手触觉、第一视角视频与手部姿态三模态同步采集,填补了机器人感知物理接触的关键空白。该项目采用低成本可穿戴方案,在真实日常环境中采集5.1小时高质量数据,证明触觉在抓握理解中具有不可替代性。与此同时,全球掀起具身智能数据基础设施竞赛,智元、戴盟等中国企业与国际团队纷纷推出百万小时级多模态数据集,推动行业从"视觉智能"向"物理智能"转型。尽管面临数据规模不足、标准不统一等挑战,但"无

2026-05-26 10:13:56 439

原创 耶鲁大学Nature Physics最新成果:大脑的复杂性,可能只是一个假象

摘要:耶鲁大学Christopher W. Lynn团队在《Nature Physics》发表研究,颠覆性地发现90%以上的神经元活动可由简单输入-输出关系解释,无需复杂交互作用。通过最大熵模型分析小鼠海马体和视觉皮层数据,证明基础逻辑回归模型即可准确预测神经元行为,且能自然推导出看似复杂的高阶和时间依赖效应。该简单性原则跨脑区、跨物种适用,挑战了神经计算复杂性的传统认知,提示大脑的强大可能源于简单单元的组织方式而非单个神经元的复杂度。研究为神经科学与AI交叉提供了重要方法论启示。

2026-05-25 09:57:13 217

原创 Nature 正刊:可穿戴膝关节机器人,重量仅为0.96 kg!让脊髓性肌萎缩症患儿重获站立能力

北京航空航天大学冯仰刚团队开发出一款仅0.96kg的便携式膝关节机器人,通过6周高强度等速训练显著改善了6名II型脊髓性肌萎缩症(SMA)患儿的下肢功能。患儿膝关节峰值扭矩提升130%,活动范围增加51%,股四头肌体积增大19%,并能独立完成坐-站转换。该研究证实等速训练可促进神经肌肉恢复,相关成果发表于《Nature》。这种轻量化、可调阻力的康复方案为神经肌肉疾病治疗提供了新思路。

2026-05-24 17:14:32 413

原创 Nature 正刊丨向蜜蜂偷师,教会了无人机长距离精准导航,内存只需42KB!

荷兰代尔夫特理工大学团队受蜜蜂导航启发,开发出仅需42KB内存的Bee-Nav系统,使30克无人机实现600米无GPS自主返航。该系统模拟蜜蜂"路径积分+视觉记忆"的双机制导航:先直线飞行快速接近目标,再通过神经网络比对视觉特征精准定位。实验显示,无人机在强风干扰下仍保持70%返航成功率,且学习区域仅需覆盖总飞行面积的0.25%-10%。这项突破为农业巡检、物流配送等场景的微型机器人应用开辟了新可能,同时为理解昆虫神经机制提供了新视角。

2026-05-22 09:20:05 374

原创 HumanNet:一百万年人类视频,给机器人一本最厚的“动手教科书”

北京大学联合SimpleSilicon团队发布HumanNet数据集,包含100万小时人类活动视频,覆盖第一/第三人称视角,为机器人学习提供新路径。该研究突破性地提出:通过观察人类行为而非机器人试错来训练具身智能。实验显示,1000小时人类视频训练的模型表现优于100小时真实机器人数据训练的版本,大幅降低训练成本。数据集采用三阶段处理流程,包含精细标注和跨实体迁移方案,为具身智能领域提供了规模化数据基础设施。这一成果或将改变机器人学习范式,开启利用人类行为数据训练智能体的新方向。

2026-05-21 10:54:01 214

原创 FoundationStereo 与 Fast FoundationStereo — 面向具身智能的高泛化双目深度估计

摘要: 本文提出FoundationStereo及其实时版本FastFoundationStereo,旨在解决机器人三维感知中低成本、高精度与跨场景泛化的难题。FoundationStereo通过大规模合成数据与单目深度先验,首次实现双目深度估计的zero-shot泛化,生成的点云质量接近高端工业相机。FastFoundationStereo通过蒸馏、架构搜索与剪枝优化,将推理速度提升至实时水平,可直接替代传统RGB-D相机。研究分析了三维感知在具身智能中的必要性,澄清了特斯拉FSD的多视角三维本质,并探讨

2026-05-20 11:08:41 257

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除