数学与人工智能

最新推荐文章于 2024-08-19 18:33:44 发布

软件供应链安全

最新推荐文章于 2024-08-19 18:33:44 发布

点赞数

文章标签：人工智能

原文链接：https://mp.weixin.qq.com/s?__biz=MzIwNjEwNTQ4Mw==&mid=2651583785&idx=1&sn=3f6809e05e8a44bb26dd9fe3cefe7442&chksm=8d493a40ff6908d717511df0474e71dd43accb0c860f1b7d71554b03405af792228b6266752e&scene=126&sessionid=0

版权

作者：鄂维南

首发于科学大院

人工智能取得的辉煌成就

Sora可以生成视频，支持用简单的文本提示生成非常逼真的视频，这可以说是开启了物理世界跟虚拟世界连接的桥梁。

谈到AI for Science，AlphaFold2用非常简洁优雅的办法，把生命科学中一个非常基础的问题（预测蛋白质结构）彻底解决了，这是我们没有预料到的。我们正在做的OpenLAM，目的是发展一个通用的大原子模型。

现有人工智能技术路线不适合中国

探索底层逻辑和基本原理

3．数学的观点

比方说，我们需要为学习过程中的数据空间和物理世界建立数学模型。当我们谈论智能时，就必须为物理世界和机器人的物理操作建立数学模型。

我还要提一下的是“心智空间”（mental space），虽然听上去有点像算命的术语，但实际上这是心理学领域的概念。现阶段对心智空间的心理学研究基本停留在描述性和概念性层面，但由于大模型的出现，我们现在有了实验工具，这是一个非常有前景的研究方向。从数学的角度，我们需要为这类研究建立相应的数学模型。

人工智能的主要技术

由于时间关系，我从数据的角度来介绍人工智能的主要技术，包括0数据、小数据、大数据、全数据。

1993年，Barron提出了一个真正的正确观点，他证明了神经网络逼近函数时，其收敛速度与维数无关。以多项式为例，要将误差降低10倍，所需的自由度数量需要指数级增长，这就产生了维数灾难。而神经网络则不受此限制，其性能与维数无关，这为我们提供了一个正确的出发点，突显了神经网络在处理高维问题上的优势。

其次，我们需要考虑模型的通用性，即模型必须能够解决所有下游任务。Open AI的“预测下一个词”模型不仅具有通用性，还是一种生成模型，这与BERT有显著不同。更重要的是，这种模型具有标度律，这为我们提供了两个重要的好处。

首先，标度律可以帮助我们预测所需的计算资源。其次，类似于摩尔定律它可以作为指导我们对未来技术发展的目标。标度律是复杂系统的一个常见现象，它揭示了大尺度上系统行为的可预测性。

此外，我们有“涌现”的概念，即量变引起质变。以人类大脑为例，尽管我们的大脑结构与动物相似，但由于体积的差异，这种量变最终导致了质的飞跃。

如何降低大模型的计算成本

最后，我们来探讨一下如何从系统的层面降低大模型的计算成本。

人工智能有两个基本任务：一是要有知识，二是要有推理能力。

从知识的角度来说，知识可以被分为不同类型，包括极高频知识（如条件反射）、高频知识（如学习得来的数学知识），以及低频知识（如通过网络查询得到的信息）。这些知识需要不同的处理方法，但在此不作深入讨论。

从推理能力来说，有时需要严格推理，有时则可以相对宽松。以AlphaGeometry为例，它通过定理库实现严格推理，而直观的辅助线添加则来源于大数据模型。这种模式值得更广泛的推广。

但最重要的是，大模型开发不是“一锤子买卖”，而应视为整个系统的一部分，系统包括：底层的计算系统、算力、系统软件、数据库、模型、智能体和机器人，上层操作系统负责任务分配。这将是未来通用人工智能的正确发展框架。自2018年以来，我就开始布局这一领域，包括推动开发国际上第一个AI数据库。

当前，探索人工智能基本原理的时机已经成熟，与过去相比，现在我们拥有了所有必要的基本条件。这一探索不仅是人工智能长期发展的基础，也是确保其持续进步的关键，对中国而言，考虑到我们在某些资源方面有所不足，从基本原理出发制定技术路线尤为重要。此外，这一过程还需要多学科人才的紧密合作。

至于我国应该如何布局人工智能战略，我认为要从整个计算产业的角度来规划。高校作为人才培养的基地，需要认识到人工智能是一个特殊的学科，并从全校层面进行战略布局。最终目标是实现人力资源和算力资源的有效对接，构建一个高质量、多层次的人才梯队。

谢谢大家。

软件供应链安全

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
数学与人工智能

作者：鄂维南首发于科学大院人工智能取得的辉煌成就Sora可以生成视频，支持用简单的文本提示生成非常逼真的视频，这可以说是开启了物理世界跟虚拟世界连接的桥梁。谈到AI for Science，AlphaFold2用非常简洁优雅的办法，把生命科学中一个非常基础的问题（预测蛋白质结构）彻底解决了，这是我们没有预料到的。我们正在做的OpenLAM，目的是发展一个通用的大原子模型。现有人工智能技术路线不适合...
复制链接

扫一扫