具身智能都有哪些技术栈?

前十年自动驾驶,后十年具身只能,一位资深自动驾驶从业者这样和我们说。

具身智能是什么?

具身智能广义上是指具有物理身体的智能体,能够与环境进行互动,感知周围世界,自主学习、决策并执行任务。说到这里,像人形机器人、四足机器人、机械臂系统、自动驾驶系统算广义上的具身智能,能够感知周围环境并作出反应或执行。GPT这类大模型从狭义上理解,当然也可以算。如果再来看工业界的产品落地,扫地机也是,只是没有那么智能罢了!

2b7d4cfe752001d7a859279b5420f500.gif

无论是特斯拉的擎天柱,抑或波士顿动力的大狗or大牛,都在解决一个事情,那就是通用人工智能。行业期望双足机器人能够类人工作劳动,比如产线机器人、陪伴机器人、服务机器人等;期望多足机器人能够完成搬运、巡检、救援等工作,将人类从无趣或危险的场景中解救出来,减少人力成本。

2fc6e83933a86d40dd2091f0090ed1d3.png

为什么具身智能开始备受青睐?

依托于AI技术的快速发展,以及各类芯片的算力提升。硬件、数据和算法相比于之前纯机器人时代已经有着大幅度提升,更多智能的技术可以快速应用到具身领域,比如自动驾驶领域的端到端、感知、规划等,大模型技术、SLAM这类建图定位、位姿估计、机械臂动力学等等。

7251cfdefb282bc6e5a88823d8b37573.png

如何将多类领先的技术和物理实体结合,是很多顶尖科研机构和机器人AI公司一直在突破的。国外有波士顿动力、特斯拉擎天柱这类具有代表性的四足和人形机器人;国内像宇树科技、云深处、智元机器人、还有各大厂的机器人实验室都在不断攻克难关,期望能够推动社会的生产变革。

软件算法与硬件都具备较高的感知和实时能力,资本自然也非常看好,可以说具身的市场绝不亚于那时的自动驾驶,相关的融资事件与岗位招募逐渐拉升,前景满满,也促使了相当多的从业者转向具身智能。

具身智能知识星球

我们最新维护的社区来啦!具身智能之心知识星球是国内首个具身智能开发者社区,创建的出发点是给大家提供一个具身相关的技术交流平台。星球内部主要关注具身智能相关的数据集、开源项目、 具身仿真平台、大模型、视觉语言模型、强化学习、具身智能感知定位、机器臂抓取、姿态估计、策略 学习、轮式+机械臂、双足机器人、四足机器人、大模型部署、端到端、规划控制等方向。也欢迎大家关注我们具身智能之心公众号,日常分享最新技术进展与行业干货。

星球内部汇总了近40+开源项目、近60+具身智能相关数据集、行业主流具身仿真平台、强化学习全栈学习路线、具身智能感知学习路线、具身智能交互学习路线、视觉语言导航学习路线、触觉感知学习路线、多模态大模型学理解学习路线、多模态大模型学生成学习路线、大模型与机器人应用、机械臂抓取位姿估计学习路线、机械臂的策略学习路线、双足与四足机器人开源方案、具身智能与大模型部署等方向,涉及当前具身所有主流方向。

为了促进行业的发展,我们前期希望更多优秀的人加入我们。

加入星球有哪些福利?

  • 第一时间掌握具身智能相关的学术进展、工业落地应用;

  • 和行业大佬一起交流工作与求职相关的问题;

  • 优良的学习交流环境,能结识更多同行业的伙伴;

  • 具身智能相关工作岗位推荐,第一时间对接企业;

  • 行业机会挖掘,投资与项目对接

星球内容一览

0)具身智能公司

星球内部为大家汇总了各类国内外各类具身相关机器人公司,涉及教育、宠物、工业、救援、物流、交互、医疗等方向。9bae4bfe3d53b46666e8e9741fd90c77.png

1)开源项目汇总

星球内部针对机器人仿真项目、机器人抓取、机器人控制、具身交互、具身感知等多个领域的开源项目进行了汇总,助力快速上手。

4537c754d7558d397621cff6e73f9595.png

2)具身智能数据集

针对具身感知、触觉感知、导航、问答、大模型、视觉语言模型、端到端、机械臂抓取、控制规划多个领域的开源数据集进行了汇总,再也不用担心找不到可用的数据集了。

f9c8f449a347dc684b84d532b0615bac.png

3)具身智能仿真平台汇总

星球内部针对通用机器人仿真平台和真实场景仿真平台进行了汇总,机器人仿真这里全都有!

db6ac09741abf89813fb0b3efb73cd7c.png

4)强化学习路线汇总

我们为大家汇总了基于LLM的强化学习、可解释强化学习、深度强化学习主流方案,一览各个子领域的应用训练。

a7dfdc6b1dc07c836416e4b4dd880677.png

5)具身智能感知学习路线

内部针对主动视觉感知、3D视觉感知定位、视觉语言导航、触觉感知等多个任务进行了汇总,具身感知路线,一网打尽。

d9399d7feb7dcc1c6cd1e2c745b414b6.png

6)具身智能交互

星球内部为大家汇总了具身智能与环境交互相关工作,涉及抓取、检测、视觉语言模型、具身问答、gaussian splatting等多块内容。

5a0d2ab6ab6a5177047c354e2932e131.png

7)视觉语言导航

针对视觉语言导航、规划等多个应用内容,星球内部进行了详细的汇总,关注自动驾驶与机器人应用。

4c776170a68e985afb4342f0de2f2243.png

8)触觉感知

我们汇总了触觉感知最新综述、传感器应用、多模态算法集成、数据集等多项内容,让大家对这一前沿应用有着深刻了解。

8429b988a333ee7a736f216ff0d787d4.png

9)多模态大模型理解

星球内部汇总了大量多模态大模型理解相关内容,  包括但不限于Image+Text到Text、 Video+Text到Text、 Audio+Text到Text、 3D+Text到Text、Many到Text等。

f5314106503985fad9e0c65702395446.png

10)多模态大模型生成

除了多模态大模型理解,星球内部也汇总了大量多模态大模型生成相关内容,包括Image+Text到Image+Text、Video+Text到Video+Text、 Audio/Speech+Text到Audio/Speech+Text、Many到Image+Text、Many到Many等。

7cbd9957c1fff908e99302d3e3ff3cc8.png

11)视觉-语言-动作

内部为大家汇总了主流的VLA模型相关内容,一览最新视觉-语言-动作相关进展。

5f56c3fe872f3571da6e4080fdd747ea.png

12)大模型微调与量化推理

6253da423ab5036c2763f72868c33f23.png

13)大模型部署相关

针对大模型部署框架、大模型轻量化方法等进行了汇总,助力落地。

0165364da1a40b0753cba940cb119d14.png

14)机械臂抓取

针对机械臂抓取、任务数据表示、位姿估计、策略学习多个部分展开了汇总。

3eba3418af48e328ce013bbb12480516.png

15)双足与四足机器人

星球内部对开源的双足与四足机器人项目、仿真、源码、硬件等部分进行了详细的汇总,助力从零搭建你的机器人。

9f2e37038795e7311f2b4cf6c7ee6320.gif

e007fcbd1a5620d29992c54d509437c9.png

扫码加入

欢迎加入具身智能之心知识星球,平均每天不到5毛钱,国内首个具身智能交流社区,这里将承担未来5-10年的技术输出与行业关注。

548d0b873d80d87be53b8bf6b83aeda3.png

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值