数学与人工智能

118b5fc6735d00bc34c9575068e6f7f1.png

00f983771411540c578dc56501f6be0a.jpeg

作者:鄂维南

首发于科学大院

7bb9ba383834c170d909cb41abebf918.png

人工智能取得的辉煌成就

37fa2da68c64e719ef40038ef1c36ef7.png

3c4726713baf8fabeceb2912b437123d.png

Sora可以生成视频,支持用简单的文本提示生成非常逼真的视频,这可以说是开启了物理世界跟虚拟世界连接的桥梁。

c523f6f99fcb2f28517857ab07c2cf63.png

谈到AI for Science,AlphaFold2用非常简洁优雅的办法,把生命科学中一个非常基础的问题(预测蛋白质结构)彻底解决了,这是我们没有预料到的。我们正在做的OpenLAM,目的是发展一个通用的大原子模型。

065bb4a302cc8ee224333c96d3780634.png

现有人工智能技术路线不适合中国

690cda41c972bba3ffff4edb11343a28.png

d08713900a0ea364a3d62d7a57d6ae07.png

探索底层逻辑和基本原理

89235fff7b62389a514a4855152a7526.png

3.数学的观点

比方说,我们需要为学习过程中的数据空间和物理世界建立数学模型。当我们谈论智能时,就必须为物理世界和机器人的物理操作建立数学模型。

我还要提一下的是“心智空间”(mental space),虽然听上去有点像算命的术语,但实际上这是心理学领域的概念。现阶段对心智空间的心理学研究基本停留在描述性和概念性层面,但由于大模型的出现,我们现在有了实验工具,这是一个非常有前景的研究方向。从数学的角度,我们需要为这类研究建立相应的数学模型。

人工智能的主要技术

由于时间关系,我从数据的角度来介绍人工智能的主要技术,包括0数据、小数据、大数据、全数据

ae9cb65fcc2ececc070121919a49d69e.png

bff6dc4cee1f5db1736f7d0822008515.png

29e7f062c3b4f96adca2349e3728657d.png

7f3c6fdf7dbbf7bc79837503e0699e6f.png

e73f4e5d94bbd12bb2727cb07a0951cc.png

7fed7e07789d7fbae461d98c6274e8fc.png

5d04045633da5324b455cb9bc227bdb6.png

1993年,Barron提出了一个真正的正确观点,他证明了神经网络逼近函数时,其收敛速度与维数无关。以多项式为例,要将误差降低10倍,所需的自由度数量需要指数级增长,这就产生了维数灾难。而神经网络则不受此限制,其性能与维数无关,这为我们提供了一个正确的出发点,突显了神经网络在处理高维问题上的优势。

3fa1b100581fcb2c04e1d90116a1163b.png

85ba14b09241a788163540e4c9f8e35f.png

29a15183b8418594c6085d7474f665a1.png

其次,我们需要考虑模型的通用性,即模型必须能够解决所有下游任务。Open AI的“预测下一个词”模型不仅具有通用性,还是一种生成模型,这与BERT有显著不同。更重要的是,这种模型具有标度律,这为我们提供了两个重要的好处。

首先,标度律可以帮助我们预测所需的计算资源。其次,类似于摩尔定律它可以作为指导我们对未来技术发展的目标。标度律是复杂系统的一个常见现象,它揭示了大尺度上系统行为的可预测性。

9821bd00556151c518df0ad1f92e30d2.png

此外,我们有“涌现”的概念,即量变引起质变。以人类大脑为例,尽管我们的大脑结构与动物相似,但由于体积的差异,这种量变最终导致了质的飞跃。

92d21cb81ef8fa9da7ecfea9e6be969a.png

如何降低大模型的计算成本

最后,我们来探讨一下如何从系统的层面降低大模型的计算成本。

人工智能有两个基本任务:一是要有知识,二是要有推理能力。

从知识的角度来说,知识可以被分为不同类型,包括极高频知识(如条件反射)、高频知识(如学习得来的数学知识),以及低频知识(如通过网络查询得到的信息)。这些知识需要不同的处理方法,但在此不作深入讨论。

从推理能力来说,有时需要严格推理,有时则可以相对宽松。以AlphaGeometry为例,它通过定理库实现严格推理,而直观的辅助线添加则来源于大数据模型。这种模式值得更广泛的推广。

但最重要的是,大模型开发不是“一锤子买卖”,而应视为整个系统的一部分,系统包括:底层的计算系统、算力、系统软件、数据库、模型、智能体和机器人,上层操作系统负责任务分配。这将是未来通用人工智能的正确发展框架。自2018年以来,我就开始布局这一领域,包括推动开发国际上第一个AI数据库。

当前,探索人工智能基本原理的时机已经成熟,与过去相比,现在我们拥有了所有必要的基本条件。这一探索不仅是人工智能长期发展的基础,也是确保其持续进步的关键,对中国而言,考虑到我们在某些资源方面有所不足,从基本原理出发制定技术路线尤为重要。此外,这一过程还需要多学科人才的紧密合作。

至于我国应该如何布局人工智能战略,我认为要从整个计算产业的角度来规划。高校作为人才培养的基地,需要认识到人工智能是一个特殊的学科,并从全校层面进行战略布局。最终目标是实现人力资源和算力资源的有效对接,构建一个高质量、多层次的人才梯队。

谢谢大家。

d7c11210baeec2d3ed62991dc1c8000b.png

d5daf60cda24cee418900d741d2f5914.jpeg

a6c19fea91394a16294505186858fc7e.jpeg

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值