何恺明：在cuhk解答AI for Science科研问题

猛码Memmat

已于 2023-11-07 17:35:39 修改

阅读量253

点赞数 1

分类专栏： vision / segmentation 文章标签：讲座人工智能 resnet

于 2023-11-02 16:44:04 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/JishuFengyang/article/details/134185244

版权

何恺明在讲座中指出大模型的未来面临数据效益问题，强调视觉自监督学习是未来三年研究重点。他认为AI将成为基础工具，但数据量增加的效益可能减少。同时，他讨论了AI模型的可解释性问题，提出实证验证的重要性，并分享了自己选择研究课题以好奇心和热情为标准的原则。

摘要由CSDN通过智能技术生成

文章目录

1. 大模型的未来：数据效益是个问题
2. 未来三年研究重点：视觉自监督学习
3. 选择课题的标准：好奇心和热情
4. AI将成为几乎所有事情的基础工具
5. 用疑问解答AI模型可解释性问题
Acknowledgement
Reference
Biography：Kaiming He
- Research Achievements
- Social Service

何恺明最近在香港中文大学参加一个讲座过程中所述：

在这里插入图片描述

1. 大模型的未来：数据效益是个问题

Q：您刚刚（演讲）展示的图片，呈现了深度网络加深时，性能先上升后下降的趋势。

起初人们可能误认为是过拟合导致的，就增加数据量，问题确实得到了改善。但又发现当神经网络真的非常深入时，性能还是会再次下降。而你的研究揭示了这其实与某种优化并不是最佳解决方案有关，基本上涉及三大要素：数据量、网络深度、模型复杂度及其优化方式。

考虑到现如今的大模型数据量比以前要大得多，那么您认为可能存在哪些局限性？或者接下来应该如何应对数据模型复杂性和优化带来的挑战？

何恺明：通常，我们认为增加网络的深度和宽度是提高神经网络模型性能的方法。而在机器学习中，拟合与泛化之间存在权衡，也就是说要实现适当的拟合并减少过拟合。

目前要想减少过拟合、提高泛化，最有效的方法就是增加数据量。

虽然大量数据的拟合和记忆仍是一个挑战，但大模型其实有足够的能力做到这一点，事实也证明增加数据量是减少过拟合的最佳解决方案。

然而展望未来，数据带来的效益是否会降低是个问题。

比如说，语言数据不是凭空产生的，而是由人类创造出来的。你在写一些新的文本时，是带有想分享信息、创作新知识等某种目的的。所以文本数据中的信息可能比许多其它形式的数据中的信息都要更丰富。

而一张新的照片可能并不会增加太多新的信息。尽管它看起来可能包含更多的信息，但实际上你每天用手机拍摄的内容也许只是你的食物或是自拍。

所以不同类型的数据所含信息量不同，继续增加数据的回报可能会有所减少。我认为这将是未来的一个开放性的问题。

Q：您提到如今深度学习像是残差学习已广泛应用于多个领域，例如AlphaGo和AlphaFold等。

在这里插入图片描述
回顾一二十年前，研究人员会专注于研究每一个具体的小问题，手动设计各种算法。但现如今，大部分问题都是由更通用的模型来学习解决的。

那么您认为未来的发展趋势是会出现一个能够处理大多数任务的大型预训练模型，而我们只需对其进行微调来适应特定的任务？还是说仍然有一些问题需要手动设计或用更具体的领域知识来解决？

何恺明：我认为这两个方向将会同步发展。

在自然语言处理中，预训练模型基本上是默认方法。但在计算机视觉领域，情况稍有不同，因为人们还没有提出一个好的想法来开发所谓的视觉基础模型。

这或许是因为视觉任务更为多样化，而且更重要的是，语言是人类智慧的产物，而像素则来自于自然，这是语言和图像之间的本质区别。

展望未来，我们希望神经网络能够处理更多的问题，比如科学问题、蛋白质、分子、材料，甚

最低0.47元/天解锁文章

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

猛码Memmat CSDN认证博客专家 CSDN认证企业博客

码龄5年

225: 原创

4951: 周排名

1万+: 总排名

23万+: 访问

: 等级

3736: 积分

7269: 粉丝

1195: 获赞

149: 评论

1507: 收藏

私信

关注

热门文章

分类专栏

Memmat 付费 37篇
prompt 7篇
vision / segmentation 21篇
main.dl 17篇
detection 6篇
rec sys 5篇
nlp 5篇
init.dl 15篇
rob-agent / aigc 19篇
ml 7篇
library / tool 19篇
environment 14篇
master 28篇
code 24篇

最新评论

Tutorial：Deep Learning for Remote Sensing Data
猛码Memmat: 半监督域适应微调框架Colabator。论文预印本链接：https://arxiv.org/pdf/2406.07966 仓库链接：https://github.com/cnyvfang/CORUN-Colabator
Tutorial：Deep Learning for Remote Sensing Data
猛码Memmat: idea：More accurate and personalised weather forecasts ？
【AI TIME】具身智能灵巧手是怎样练成的？
猛码Memmat: openly accessible journal（OA期刊）
启发式算法python示例：元启发式算法 Metaheuristic Algorithm
猛码Memmat: 在处理大量视频时，采用检索增强生成（RAG）技术是一个有效的策略。首先，需要对视频进行基本分析，包括场景识别、语音转文本、物体识别等。根据场景变化、话题转换或时间段，将视频切分成更小的片段。这些片段可以是短视频、关键帧序列或转录文本。可以使用文本摘要、关键帧、特征向量等方式来表达视频片段的内容。通过自然语言描述或标签，对片段进行进一步注释，便于检索。将切分后的片段存入一个知识库。在用户提问时，从知识库中检索相关片段，并结合生成模型生成回答。在医疗领域，视频内容可能涉及复杂的医学术语、诊断影像等，因此需要专业的知识库和模型进行支持。特殊的隐私和数据安全要求也需要考虑。通过这样的步骤，可以有效地对大量视频进行管理和问答。
启发式算法python示例：元启发式算法 Metaheuristic Algorithm
猛码Memmat: CRUD是四个基本操作的缩写，它们分别是Create（创建）、Read（读取）、Update（更新）和Delete（删除）。这四个操作是数据库管理和软件开发中非常基础且常见的功能，几乎涵盖了数据操作的所有基本需求。 Create（创建）：这个操作通常用于在数据库中添加新的记录或条目。在Web应用中，这通常意味着用户提交了一个表单，表单中的数据被收集并存储到数据库中。例如，在一个用户管理系统中，用户可以通过填写表单来创建一个新的用户账户。 Read（读取）：这个操作用于从数据库中检索数据，以便在应用程序中展示或处理。读取操作可以根据不同的需求以不同的方式执行，比如查询所有记录、查询特定条件的记录、分页查询等。在Web应用中，这通常涉及到显示数据列表、详情页面等。 Update（更新）：当数据需要修改时，就会使用更新操作。这可以包括更改记录的字段值、更新状态或任何其他需要修改的数据。在Web应用中，用户可能会提交一个表单来更新他们的个人信息，比如电子邮件地址或密码。 Delete（删除）：这个操作用于从数据库中移除不再需要的记录。删除操作需要谨慎处理，以确保不会意外删除重要数据。在Web应用中，用户可能会请求删除他们自己的账户或某些数据项。 CRUD操作是大多数数据库和Web应用程序的核心功能。了解并熟练掌握这些操作是进行数据库管理和Web开发的基础。随着技术的发展，CRUD操作也可以通过各种框架和工具来自动化和简化，从而提高开发效率和质量。

最新文章

2024

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

猛码Memmat 欢迎支持，随缘打赏 ~

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。