具身智能总结

锤你胸口

已于 2024-08-13 22:11:53 修改

阅读量228

点赞数 9

文章标签：人工智能

于 2024-08-13 22:11:51 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_50463285/article/details/141141014

版权

具身智能
环境理解 OpenCV 目标检测目标分割自动驾驶
智能交互语音识别（大语言模型GPT）
认知推理大语言
规划执行系统化

PyBullet 仿真环境

Navigation
使用MaskRCNN进行目标检测和像素分割
使用MiDaS单目深度估计进行RGBD传感器数据修复？？？
分割后的Semantic Map进行环境建图导航
使用Super GLUE进行图像和图像匹配
特征点匹配、搜到图像然后去导航
使用CLIP进行文本和图像匹配
使用Mistral 7B 从复杂指令抽提Object Category

基础技术路线
环境理解检测、分割多模态Grounding
SAM、SAM3D Open-Voc Dection Open-Voc Dection in Point Cloud
多模态Grounding 实现对图片的理解能够实现像素级别的识别
多模态大模型多模态、多任务赋能LLM具🈶更通用的场景理解能力
数据引导视频学习、硬件在环、生成式仿真
机器人数据集较少；视频数据去引导；
DexCap slam手指末端在3D环境逆运动学
HIRO Hand 灵巧手搜集的数据更加全
heavy hardware VR+VR手套（特斯拉、Sanctuary AI）
手套可以把手指的运动映射到指关节上
动作执行生成式模仿学习 Affordance 大模型问答大模型Prompt规划
生成式模仿学习
language corrections Language矫正
世界模型
3D VLA
LAPO
可以做一个模糊预测来设计控制器来选择最优action

challenge
大脑->

小脑->灵巧操作能力有待提升
数据获取能力

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。