AI模型是否是越大越好

海森大数据

已于 2023-03-27 08:33:30 修改

阅读量529

点赞数

文章标签：人工智能科技

于 2023-03-27 08:30:35 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/haisendashuju/article/details/129788083

版权

深度学习领域中，大模型虽能提升表现力，但也带来计算成本增加和应用问题。马毅、曹颖与沈向洋提出压缩闭环转录框架，强调简约性和自洽性原则，以解决大模型的挑战。简约性关注紧凑表示，自洽性关乎学习方法，两者结合或能优化AI模型的学习过程。

摘要由CSDN通过智能技术生成

不知不觉间，深度学习已经火热了十年，在深度学习领域，模型大小是一个非常重要的话题。在过去的几年中，随着神经网络模型的复杂度不断提高，模型大小也越来越大。大模型可以提供更高的表现力，更好地捕捉数据中的模式和规律。

然而大模型也使得 AI 模型的规模不断增大，计算成本不断增加，且在落地应用中出现了许多问题，如神经崩溃导致学习到的表征缺少多样性，模式崩溃导致训练缺乏稳定性，模型对适应性和对灾难性遗忘的敏感性不佳等等。

AI模型更大并不一定更好。虽然大型模型可以提供更高的表现力和更好的泛化性能，但它们需要更多的计算和存储资源。

人工智能领域的三位知名华人科学家马毅、曹颖与沈向洋联名在arXiv上发表了一篇文章，“On the Principles of Parsimony and Self-Consistency for the Emergence of Intelligence”，提出了一个理解深度网络的新框架：压缩闭环转录（compressive closed-loop transcription）。

这个框架包含两个原理：简约性（parsimony）与自洽性/自一致性（self-consistency）：

所谓简约性，就是“学习什么”。智能的简约性原理，要求系统通过计算有效的方式来获得紧凑和结构化的表示。

自洽性是关于“如何学习”，即自主智能系统通过最小化被观察者和再生者之间的内部差异来寻求最自洽的模型来观察外部世界。

仅凭借简约原理并不能确保学习模型能够捕获感知外部世界数据中的所有重要信息。

总的来说，AI模型的大小是一个需要综合考虑多个因素的问题。

海森大数据

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

海森大数据 CSDN认证博客专家 CSDN认证企业博客

码龄3年

293: 原创

17万+: 周排名

1万+: 总排名

26万+: 访问

: 等级

3289: 积分

203: 粉丝

203: 获赞

13: 评论

319: 收藏

私信

关注

热门文章

最新评论

脑机接口（BCI）助力失语者重获交流能力：纽约大学最新研究突破
普通网友: 每当我阅读你的编程博客文章时，我总能感受到你的专业水平和耐心解答的精神。【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
脑机接口（BCI）助力失语者重获交流能力：纽约大学最新研究突破
普通网友: 优质好文，博主的文章细节很到位，兼顾实用性和可操作性，期待博主持续带来更多好文【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
脑机接口（BCI）助力失语者重获交流能力：纽约大学最新研究突破
普通网友: 博主的文章让我对这个主题有了全新的认识，细节描写非常到位，让我感受到了博主的深厚功底。【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
清华大模型XAgent登GitHub热榜！复杂任务轻松搞定
jackyjia844: 这个可以尝试使用吗？大神有方法吗？
GPT-4成Nature审稿人，超 50% 结果和人类评审一致
白话机器学习: 通过文章可以看出，博主很有耐心，技术文章不仅是对技术的坚守，更是对知识的热忱和热爱，感谢您的优质分享和坚持更文。期待着博主更加深入的剖析，为大家带来更多的技术好文。

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。