人工智能（AI）从实验室到实际应用有何大不同？

XAI嬴图

于 2021-10-13 17:30:01 发布

阅读量380

点赞数

分类专栏：嬴图文库文章标签：人工智能知识图谱机器学习图计算图数据库

本文链接：https://blog.csdn.net/Ultipa/article/details/120748605

版权

嬴图文库专栏收录该内容

124 篇文章

订阅专栏

本文探讨了第三代人工智能的发展，强调了数据、知识、算法和算力的协同作用。图计算作为第三代AI的典型技术，从学术界的静态、无属性、单边图研究转向工业界的需求，面临动态、多属性、大规模和用户体验的挑战。学术界与工业界在图数据特点上的差异导致现有图计算框架在实际应用中遇到问题，需要更贴近应用的解决方案。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

第三代人工智能是2019-2021年间由中国人工智能之父、中科院院士清华大学张钹教授率先提出的。区别于第一代人工智能（1950-1980年代）着重于计算机推理运算；第二代人工智能（1990-当下）以机器学习与深度学习，广泛存在算法黑盒化、计算不可解释且算力浪费严重、计算效率低下等问题，第三代人工智能需要数据、知识、算法与算力四要素协同，注重算法白盒化可解释，以及算力的大幅提升。图计算（图数据库）被认为是一种典型的通过增强智能方式实现的稳健的、更贴近人类智能的——第三代人工智能技术。

图：清华张钹院士专刊文章：迈向第三代人工智能

全文链接：http://scis.scichina.com/cn/2020/SSI-2020-0204.pdf

从实验室到实际应用这个问题也许改为：从高校实验室到工业界实际应用有何大不同更为准确一些。

图计算肇始于学术界对图论的研究，从最早的200多年前的欧拉的七桥问题演化出早期图论，再到后来的地图上色问题、20世纪60年代的随机图理论研究、多种最短路径算法，以及过去20年间随着大数据框架和理论发展而形成的各种社交图谱（图数据集）研究。

欧拉的七桥问题演化出早期图论

这些偏学术研究的图数据集都有一个非常典型的特点：

1.简单图，也可以叫单边图，英文是simple-graph。
2.同构图，学术界的图基本都是同构数据，比如路网、社交网络数据……
3.静态图，图数据集一次性导入计算框架，之后不再更改，如果更改，则需要重新加载。
4.无属性，除了可能的方向之外，几乎没有属性，完全依赖图集所形成的拓扑结构（topology）来进行计算分析。
5.通常学术研究的都是小图（比如一般都是几千个点的图），大图几乎都是合成出来的，为了造出大图而生产出大图，而且只有一张图，图与图之间不会有任何关联关系，更不用说联动）。
6.根本无需考虑用户体验。

单边图 vs. 多边图

如果我们来总结工业化图数据的特点：

多边图，英文称为Multi-graph。
异构图，工业界不能仅限于同构图，这个太理想化了，异构图、多源融合数据需要被支持……
动态图，数据不断动态变化，包括增删改查等操作。
多属性：例如金融行业，交易图谱等，点、边都会有多种属性！
一般都是中大图，从几百万到几亿、几十亿的规模；也会有千亿规模的图，但是往往会形成多张图，图与图之间可能会联动。
用户体验是必要的一环。

上面这几点已经能说明学术界和工业界的区别!

双方的研究对象、解决问题的思路和出发点都不同。

结果就是，今天几乎所有学术界产出的图计算框架都符合学术界的特点——静态、无属性、单边..……

很多工业界的图数据库是从学术界出发的，可想而知在底层架构上面他们就会遇到各种各样的挑战，例如无法很好的应对动态的、海量的数据、无法对多边模式进行直观、便捷的数据建模（如上图所示）、包括用户体验等等。

人才很多都源自于学术界的培养，但是很多时候，象牙塔里面做了太多的假设，理论很丰富，工程能力和实践很骨感，久而久之一定会与工业界脱节。

最好的、最流行的关系型数据库不是象牙塔里面构建的，无论是从IBM的System R到后面的Oracle，还是Sun Microsystems的Mysql或者是PostgreSQL；图数据库大抵也会遵循类似的思路，工业界的解决方案更贴近应用贴近客户需求，或可在很大程度上反哺学界。

理论到实践，基本就是实验室与实际应用之间的“大不同”之所在。

·END·