自监督学习,让AI学会推理

如何突破当代人工智能(AI)的瓶颈?图灵奖得主杨立昆(可打开海森公众号查看对杨立昆的介绍),自监督学习可能使AI产生类人的推理能力。自监督学习,可以让AI像人一样自觉观察世界

他在博客上深度阐述了他的自监督学习思路,他认为AI想要突破现在的瓶颈,必须让机器学习世界模型,从而能够填补缺失的信息,预测将要发生的事情,并预测行动的影响。

那么什么是自监督学习呢?

自监督学习旨在对于无标签数据 ,通过设计辅助任务(Proxy tasks) 来挖掘数据自身的表征特性作为监督信息,来提升模型的特征提取能力。

杨立昆为自监督学习做了类比,「不管是我们人类,还是动物,在学习大多数事物时,都是在自我监督的模式下进行的,而不是强化学习模式。这个模式本质上就是观察这个世界,然后不断与之增进互动,这种观察是自发的,而不是在测试条件下完成的。」杨立昆表示, 「这种学习方式,比较难以用机器来复制。」

普通的监督式学习需要在有标注的数据集上训练AI模型,监督学习的局限性有时会被误以为是深度学习的局限性,这些限制可以通过自监督学习来克服。

当然,单单自监督学习是不够的,我们还需要搭配“世界模型”来进行研究,世界模型需要融合不同的学科的观点,包括但不限于认知科学、系统神经科学、最优控制、强化学习以及 "传统 "人工智能。使机器能够以自监督的方式学习世界模型,然后使用这些模型进行预测、推理和规划。

自我监督学习的主要好处之一是AI能够主动输出巨大的信息量。在强化学习中,训练AI系统是在标量级别执行的,模型会收到一个数值作为对其行为的奖励或惩罚。在监督学习中,AI系统为每个输入结果预测类别或数值。

在自监督学习中,输出结果将涉及到整个图像或是一组图像,「自监督学习输出的信息量很大。要让AI学习相同量的有关世界的知识,自监督学习需要的样本量也更少。」 杨立昆说。

自监督学习是AI的未来,自监督学习背后的核心想法,是开发一种深度学习系统,可以通过学习填补AI未知的领域。

杨立昆说,「如果说人工智能是一块蛋糕,那么自监督学习就是其中最大的一块。」

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值