普罗米修船
码龄7年
关注
提问 私信
  • 博客:6,187
    6,187
    总访问量
  • 2
    原创
  • 610,918
    排名
  • 5
    粉丝
  • 0
    铁粉
IP属地以运营商信息为准,境内显示到省(区、市),境外显示到国家(地区)
IP 属地:上海市
  • 加入CSDN时间: 2017-12-15
博客简介:

weixin_41407147的博客

查看详细资料
个人成就
  • 获得9次点赞
  • 内容获得1次评论
  • 获得39次收藏
创作历程
  • 3篇
    2023年
成就勋章
兴趣领域 设置
  • 人工智能
    tensorflow
创作活动更多

AI大模型如何赋能电商行业,引领变革?

如何使用AI技术实现购物推荐、会员分类、商品定价等方面的创新应用?如何运用AI技术提高电商平台的销售效率和用户体验呢?欢迎分享您的看法

179人参与 去创作
  • 最近
  • 文章
  • 代码仓
  • 资源
  • 问答
  • 帖子
  • 视频
  • 课程
  • 关注/订阅/互动
  • 收藏
搜TA的内容
搜索 取消

Code as Policies: LanguageModel Programs for Embodied Control

​在代码完成上训练的大型语言模型(LLM)已被证明能够从文档字符串合成简单的Python程序[1]。我们发现,这些代码编写LLM可以被重新用于编写机器人策略代码,给定自然语言命令。具体来说,策略代码可以表达函数或反馈循环,处理感知输出(例如,来自对象检测器[2]、[3]),并参数化控制原语API。当提供几个示例语言命令(格式化为注释)以及相应的策略代码(通过少射提示)作为输入时,LLM可以接受新命令,并自主重组API调用以生成新策略代码。通过链式经典逻辑结构和引用第三方库(例如NumPy、Shapely)
原创
发布博客 2023.08.03 ·
605 阅读 ·
1 点赞 ·
0 评论 ·
2 收藏

翻译:视觉语言动作模型,将在线知识转化到机器人控制RT-2: Vision-Language-Action ModelsTransfer Web Knowledge2Robotic Control

在广泛的网页规模数据集上预训练的高容量模型为各种下游任务提供了有效而强大的平台:大型语言模型不仅能使文本生成流畅(Anil等人,2023;Brohan等人,2022;OpenAI,2023),而且能解决新出现的问题(Cobbe等人,2021;Lewkowycz等人,2022;Polu等人,2022)并创造性地生成散文(Brown等人,2020;OpenAI,2023)和代码(Chen等人,2021),而视觉-语言模型则能实现开放词汇的视觉识别(Kirillov等人,2023;Minderer等人,2022。
原创
发布博客 2023.07.30 ·
1484 阅读 ·
0 点赞 ·
1 评论 ·
6 收藏

大语言模型LLMs驱动机器人 李飞飞 VoxPoser: Composable 3D Value Maps for Robotic Manipulation with Language Models

在这项工作中,我们的目标是合成机器人轨迹,即一个密集的6自由度末端执行器航点序列,用于处理给定开放集合的指令和开放集合的对象的各种操作任务。我们首先观察到LLMs擅长根据自由形式的语言指令推断出可供性和约束。更重要的是,通过利用他们的代码编写能力,他们可以与视觉语言模型(VLM)交互,组合3D价值地图 *3D Value Map*,将知识固定在代理的观察空间中。然后,将组合的价值地图用于基于模型的规划框架中,以zero-shot方式合成对动态干扰具有鲁棒性的闭环机器人轨迹。
翻译
发布博客 2023.07.12 ·
4075 阅读 ·
8 点赞 ·
0 评论 ·
29 收藏