腾讯机器人 1 号位创业:上得厅堂下得厨房,还会弹奏、跳舞、打篮球的机器人,你见过吗?...

4f9b26b58ec9080dad201cb8f3d737d9.gif

真正的智能(即很多人所说的世界模型),上层将可以理解逻辑、中层用于理解物理世界、下层则与世界进行交互。

作者 | 王启隆

出品丨AI 科技大本营(ID:rgznai100)

今年年初,斯坦福曾经靠一台“炒菜机器人”刷爆了各大社交平台,引起了许多人对机器人领域的关注。在国内也有这样一支团队,他们的机器人在今年四月首次技术展示中同样实现了颠锅炒菜的能力,并且还会熨叠衣物、吸尘清洁,有一手“叠杯子”的绝活。

082c19bfeb85fa211338097ff153f69d.gif

就在昨天,这台机器人正式亮相,进一步拓展了能力范围。它就是由星尘智能最新发布的新一代 AI 机器人助理 Astribot S1,将于 8 月 21 日在北京举办的世界机器人大会上面向公众展示。这次,S1 机器人直接学会了演奏高难度的中国乐器 —— 扬琴。

3b89a36fa88daf05efda1eb0396ada90.gif

CSDN 采访到星尘智能的创始人来杰,他解释了选择扬琴的原因:“扬琴既能体现 S1 的操作精确度,又能体现它的速度和力度控制。” 值得一提的是,为了提高演奏水平,星尘智能还特意邀请了专业的扬琴老师进行指导。

除了弹琴,S1 还能在食物制作、泡功夫茶等长序列任务展现了智能规划与操作能力,甚至可以媲美专家的敏捷、灵巧与丝滑度,打一套出色的“咏春拳”。

四月份的时候,我们还只能看到 S1 展示胸部以上的活动能力,所以此次最新发布揭秘了 S1 的整机形态,成功露出了“机脚”,包括新增的腰部结构和移动底盘。来杰特别提到了 S1 的仿人腰部设计:“加入腰部不仅扩大了操作空间,还能更好地模拟人体的力量分配。” 

选择轮式底盘,其实不是因为不会做“脚”,来杰特意澄清了团队完全具有双足机器人的开发能力,而是对于现有这么灵巧、柔顺的操作能力,如何拓展它的空间,如何能把全身的平衡点加起来,所以还是设计了仿人的腰。

有了小蛮腰的 S1,现在会跳海草舞

更值得注意的是,S1 采用了基于“”的思考和操作方式。来杰解释道:“人在操作时会意识到胳膊和腰用了多大劲,我们的机器人也是如此。这种基于力的思考方式让 S1 的操作更接近人类,也更加灵活。” 

这种对力的精确控制不同于主流基于轨迹控制的机器人,因为在现实中,盲人开门是不会像机器人一样构建轨迹的,而是靠力度感知黑暗的世界;同样的道理适用于切菜上,我们不会在削黄瓜和切萝卜的时候像构建运动轨迹,而是把刀压在菜上掌控力度去切。这些巧思都是些现实世界的常识,但正是有这些常识,才能让机器人真正像人一样学习、思考和劳动

95f300a586f225738370444116cd4bcd.gif

S1 做华夫饼

b6d0134d4ab4018eb81f7f0761d975d9.png

具身智能是大语言模型和世界模型之间的桥梁

2022 年默默出道,2024 年就发出了业界领先的机器人,大家现在都对星尘智能非常好奇。CSDN 就星尘智能的创业契机进行了提问,试图进一步了解这家仍带有神秘色彩的公司:目前,开发团队来自腾讯、谷歌、华为、大疆等企业,及国内外顶尖高校和人工智能研究院,创始人来杰则拥有 16 年机器人研发经验,曾是腾讯机器人实验室 1 号员工、百度“小度机器人”负责人。

da67a57363f7268d3b9b566d07f17320.jpeg

来杰如此回答我们:“机器人行业是让人很兴奋的行业,但按照十年前来说,这个行业只让人有幻想,还没有达到真正的理想。我做这个行业十几年,一直希望它达到今天这个程度,但确实之前发展的非常慢。‍”

‍他特别提到,2022 年 4 月谷歌 PaLM-SayCan ‍‍的出现是一个重要转折点,它为解决上层模型的问题提供了新的思路。到了2022 年底,来杰和伙伴们都憋不住想出来创业,就此成立了星尘智能,而这一切都早于 ChatGPT 的正式发布。但来杰与其团队就已经敏锐地预感到类似于 ChatGPT 的产品即将出现。他甚至进行了更前瞻性的预想:真正的智能(即很多人所说的世界模型),上层将可以理解逻辑、中层用于理解物理世界、下层则与世界进行交互。” 

来杰还详细介绍了星尘智能的发展历程、技术创新和未来愿景。尽管成立时间不长,但这家公司的发展速度令人瞩目:“我们在 2024 年 1 月就开发出了原型机,经过几个月的持续训练,我们在 4 月份首次对外亮相并发布了 S1 的技术展示。”

技术路线上,星尘智能强调软硬一体化发展,既关注硬件的准确度,也重视软件的灵活性。来杰归纳道,“软硬一体”代表机器人既能把握硬的准度,又能把握软的力度,星尘智能的结构设计、很底层的硬件设计,都是追求这两者之间的平衡点。在 AI 和机器人的结合方面,星尘智能采取了开放和灵活的态度。来杰表示:“我们不排斥端到端,也不排斥分层模型。我们会根据当前的数据量和任务需求,选择最合适的方法。” 这种灵活的方法论允许 S1 在不同阶段和场景下都能发挥最佳性能。

S1 的性能指标令人印象深刻。机器人单臂额定负载达到 10 千克,重复定位精度可以达到 0.03mm,这些指标全面超越了现有的协作机器人,甚至在某些方面超越了人类的能力。此外,S1 的动作顺滑,没有延迟,这源于 AI 对人体运动数据的学习和底层对力的精确控制。

dc6ad8a42e16e31257cedc6021345201.gif

来杰对具身智能的发展有着深刻的见解。他认为:“具身智能是大语言模型(LLM)和世界模型之间的桥梁。” 他进一步解释道,“我们看到了前一步是大模型和机器人的结合,现在我们发现了后一步,AI 和机器人、大模型结合之后有可能产生的世界模型未来的发展。”

da0bffe68922407e957cfa9b8e0b547e.png

希望机器人能达到一辆车的价格

在展示了令人惊叹的技术创新后,星尘智能的下一个挑战是如何将这些技术转化为可持续的商业模式。在商业化策略方面,星尘智能采取了循序渐进的方法。来杰表示,公司计划在 2024 年 12 月进行首批产品的交付。然而,这批产品并非面向普通消费者,而是针对科研用户。

“其实上次发视频之后找我们的订单非常多,但我们觉得在这个时间段,我们跟具身行业还是强绑定,所以这批交付主要是针对科研用户,”来杰解释道,“但科研用户是经过筛选的,也就是说我们跟他们不只是买卖关系,更期望达到一种合作关系,我们一起在这个方向上推动行业的发展。

在 B 端市场,星尘智能正在积极探索生物医疗、化学实验等领域的应用。来杰举例道:“如果给一位化学家配 10 个机器人助理,他用于创造的时间甚至可以翻几倍……之前我说屠呦呦做了两百多次实验,花了一年半,最后发现了青蒿素,但如果那时她用了 10 个星尘的机器人,可能三个月就能完成了。” 

对于 C 端市场,尽管目前 S1 主要用于展示其泛化能力和复杂操作能力,但星尘智能的长期目标是将 AI 机器人助理真正带入家庭。来杰坦言,要实现这一目标还面临不少挑战,其中最关键的是成本控制和安全性问题。

675326f81278ddb145dfa47c13fdf84e.gif

在成本控制方面,来杰表示:“关注成本之前我更关注的是我们自己的产品应用,也就是说产品在现有情况下所需要接受的,我需要走在这个行业发展最前列,而不是快速把自己卷下去,这是我们公司一直坚持的。” 他认为,成本控制不仅仅是一个公司的事情,而是需要整个供应链的协同努力。“我们在深圳那边接触的供应商非常多,我发现其中有一个问题在于,供应商不一定是没有能力做这件事,而是没有形成完整市场链条时他不愿意投入,只要他开始转型,这个事情就会好做很多,整个行业就会进入发展。”

来杰对供应链转型持乐观态度,他预计在两年内就会看到明显的进展。“我觉得时间会非常快,应该在两年之内,我现在接触过的,包括很多上市公司的上游供应链,他们已经开始思考他们的技术如何在机器人上面应用,他们来做一些自己的内部转型,这是一个很向上的信号,他们的介入才是真正整个行业的转型,不光是我们自己做一些东西。”

在安全性方面,来杰强调这是公司重点关注的方向。“真正用到家庭时,它对安全性的要求会非常高。这也是我们的方向,我们认为必须把这两点做好。” 正如前文所述,S1 的力控制能力为其安全性奠定了基础。

关于未来的价格定位,“我们希望能达到一辆车的价格,随着整个行业的发展,它会逐渐变成大众都能接受的价格。

a10122a8b12ee45108b29f1c0ffeee6e.gif

大模型刷新一切,让我们有着诸多的迷茫,AI 这股热潮究竟会推着我们走向何方?面对时不时一夜变天,焦虑感油然而生,开发者怎么能够更快、更系统地拥抱大模型?《新程序员 007》以「大模型时代,开发者的成长指南」为核心,希望拨开层层迷雾,让开发者定下心地看到及拥抱未来。

读过本书的开发者这样感慨道:“让我惊喜的是,中国还有这种高质量、贴近开发者的杂志,我感到非常激动。最吸引我的是里面有很多人对 AI 的看法和经验和一些采访的内容,这些内容既真实又有价值。”

能学习到新知识、产生共鸣,解答久困于心的困惑,这是《新程序员》的核心价值。欢迎扫描下方二维码订阅纸书和电子书。

e68f21d09419c51cae91d495f35adc36.jpeg

  • 16
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值