自监督学习，让AI学会推理

最新推荐文章于 2024-07-15 21:16:37 发布

海森大数据

最新推荐文章于 2024-07-15 21:16:37 发布

阅读量341

点赞数

文章标签：学习人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/haisendashuju/article/details/125214605

版权

如何突破当代人工智能（AI）的瓶颈？图灵奖得主杨立昆（可打开海森公众号查看对杨立昆的介绍），自监督学习可能使AI产生类人的推理能力。自监督学习，可以让AI像人一样自觉观察世界

他在博客上深度阐述了他的自监督学习思路，他认为AI想要突破现在的瓶颈，必须让机器学习世界模型，从而能够填补缺失的信息，预测将要发生的事情，并预测行动的影响。

那么什么是自监督学习呢？

自监督学习旨在对于无标签数据，通过设计辅助任务（Proxy tasks）来挖掘数据自身的表征特性作为监督信息，来提升模型的特征提取能力。

杨立昆为自监督学习做了类比，「不管是我们人类，还是动物，在学习大多数事物时，都是在自我监督的模式下进行的，而不是强化学习模式。这个模式本质上就是观察这个世界，然后不断与之增进互动，这种观察是自发的，而不是在测试条件下完成的。」杨立昆表示，「这种学习方式，比较难以用机器来复制。」

普通的监督式学习需要在有标注的数据集上训练AI模型，监督学习的局限性有时会被误以为是深度学习的局限性，这些限制可以通过自监督学习来克服。

当然，单单自监督学习是不够的，我们还需要搭配“世界模型”来进行研究，世界模型需要融合不同的学科的观点，包括但不限于认知科学、系统神经科学、最优控制、强化学习以及 "传统 "人工智能。使机器能够以自监督的方式学习世界模型，然后使用这些模型进行预测、推理和规划。

自我监督学习的主要好处之一是AI能够主动输出巨大的信息量。在强化学习中，训练AI系统是在标量级别执行的，模型会收到一个数值作为对其行为的奖励或惩罚。在监督学习中，AI系统为每个输入结果预测类别或数值。

在自监督学习中，输出结果将涉及到整个图像或是一组图像，「自监督学习输出的信息量很大。要让AI学习相同量的有关世界的知识，自监督学习需要的样本量也更少。」杨立昆说。

自监督学习是AI的未来，自监督学习背后的核心想法，是开发一种深度学习系统，可以通过学习填补AI未知的领域。

杨立昆说，「如果说人工智能是一块蛋糕，那么自监督学习就是其中最大的一块。」

海森大数据

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

海森大数据 CSDN认证博客专家 CSDN认证企业博客

码龄3年

292: 原创

13万+: 周排名

1万+: 总排名

26万+: 访问

: 等级

3256: 积分

195: 粉丝

180: 获赞

13: 评论

299: 收藏

私信

关注

热门文章

最新评论

脑机接口（BCI）助力失语者重获交流能力：纽约大学最新研究突破
普通网友: 每当我阅读你的编程博客文章时，我总能感受到你的专业水平和耐心解答的精神。【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
脑机接口（BCI）助力失语者重获交流能力：纽约大学最新研究突破
普通网友: 优质好文，博主的文章细节很到位，兼顾实用性和可操作性，期待博主持续带来更多好文【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
脑机接口（BCI）助力失语者重获交流能力：纽约大学最新研究突破
普通网友: 博主的文章让我对这个主题有了全新的认识，细节描写非常到位，让我感受到了博主的深厚功底。【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
清华大模型XAgent登GitHub热榜！复杂任务轻松搞定
jackyjia844: 这个可以尝试使用吗？大神有方法吗？
GPT-4成Nature审稿人，超 50% 结果和人类评审一致
白话机器学习: 通过文章可以看出，博主很有耐心，技术文章不仅是对技术的坚守，更是对知识的热忱和热爱，感谢您的优质分享和坚持更文。期待着博主更加深入的剖析，为大家带来更多的技术好文。

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。