9.2【人工智能与深度学习】世界模型和生成对抗网络

106 篇文章 8 订阅 ¥29.90 ¥99.00
76 篇文章 2 订阅 ¥29.90 ¥99.00
本文探讨了自主控制的世界模型,强调了世界模型在自监督学习中的重要性,特别是在模仿人类如何理解物理世界。文章介绍了世界模型的组成部分,包括感知模组、演员模组、模型模组和评判家模组。接着,讨论了经典设定下的最优控制,如模型预测控制,并将其与强化学习进行了比较。此外,文章还深入解析了生成对抗网络(GAN)的工作原理和在人工智能领域的应用,特别是作为对比学习方法的能量模型。
摘要由CSDN通过智能技术生成

【人工智能与深度学习】世界模型和生成对抗网络

自主控制世界模型

自监督学习的一个重要用处是用来学习世界模型。当人们做事情时,我们有着一个内在模型来模拟世界是怎么运作的,譬如当我们9个月大的时候,我们能够通过观察外界来培养物理概念的直觉思维,在某种意义上来说这和自监督学习非常相似。正如自监督模型学习隐变量的过程一样,我们通过学习如何预测将会发生的事情来学习抽象概念。进一步来说,我们的内在模型让我们能对外界有所反应。比如说,当我们学到了物理直觉和怎样控制手后,我们可以用这些学会的东西来预测和进行“抓住一支正在往下掉的笔”这一行为。

什么是“世界模型”?

自动化智能系统是由四个主要模组组成的(图1)。第一个模组是用来观察和计算世界表征的感知模组。这通过观察而计算出来的世界表征其实并不完整,这是因为

  • 1)主体并不能观察到整个宇宙;
  • 2)观察到的也并不一定准确。

有一点要注意的是,在前馈模型中感知模组只存在于第一个时间步中。第二个模组是基于观察到的表征来计算有可能的下一步的演员模组(也叫策略模组)。第三个模组是模型模组。当给定世界表征(有时候还有隐变量)后,这模组可以用来预测下一步行动后世界表征将会变成怎么样。这预测会被传到下一个时间步来当作下一个世界表征。正因如此,在最开始的时间步后,模型模组就代替了感知模组来计算世界表征。图2详细地描述了这前馈过程。第四个模组是计算行动所会带来的代价的评判家模组。譬如说,当给定了笔往下掉的速度后,如果一个人以某种方式来移动他的手,那他有多大可能性会抓不住这往下掉的笔。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

prince_zxill

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值