人工智能(AI)从实验室到实际应用有何大不同?

第三代人工智能是2019-2021年间由中国人工智能之父、中科院院士清华大学张钹教授率先提出的。区别于第一代人工智能(1950-1980年代)着重于计算机推理运算;第二代人工智能(1990-当下)以机器学习与深度学习,广泛存在算法黑盒化、计算不可解释且算力浪费严重、计算效率低下等问题,第三代人工智能需要数据、知识、算法与算力四要素协同,注重算法白盒化可解释,以及算力的大幅提升。图计算(图数据库)被认为是一种典型的通过增强智能方式实现的稳健的、更贴近人类智能的——第三代人工智能技术

图:清华张钹院士专刊文章:迈向第三代人工智能

全文链接:http://scis.scichina.com/cn/2020/SSI-2020-0204.pdf

从实验室到实际应用这个问题也许改为:从高校实验室到工业界实际应用有何大不同更为准确一些。

图计算肇始于学术界对图论的研究,从最早的200多年前的欧拉的七桥问题演化出早期图论,再到后来的地图上色问题、20世纪60年代的随机图理论研究、多种最短路径算法,以及过去20年间随着大数据框架和理论发展而形成的各种社交图谱(图数据集)研究。

欧拉的七桥问题演化出早期图论

这些偏学术研究的图数据集都有一个非常典型的特点:

1.简单图,也可以叫单边图,英文是simple-graph。
2.同构图,学术界的图基本都是同构数据,比如路网、社交网络数据……
3.静态图,图数据集一次性导入计算框架,之后不再更改,如果更改,则需要重新加载。
4.无属性,除了可能的方向之外,几乎没有属性,完全依赖图集所形成的拓扑结构(topology)来进行计算分析。
5.通常学术研究的都是小图(比如一般都是几千个点的图),大图几乎都是合成出来的,为了造出大图而生产出大图,而且只有一张图,图与图之间不会有任何关联关系,更不用说联动)。
6.根本无需考虑用户体验。

单边图 vs. 多边图

如果我们来总结工业化图数据的特点:

多边图,英文称为Multi-graph。
异构图,工业界不能仅限于同构图,这个太理想化了,异构图、多源融合数据需要被支持……
动态图,数据不断动态变化,包括增删改查等操作。
多属性:例如金融行业,交易图谱等,点、边都会有多种属性!
一般都是中大图,从几百万到几亿、几十亿的规模;也会有千亿规模的图,但是往往会形成多张图,图与图之间可能会联动。
用户体验是必要的一环。

上面这几点已经能说明学术界和工业界的区别!

双方的研究对象解决问题的思路出发点都不同。

结果就是,今天几乎所有学术界产出的图计算框架都符合学术界的特点——静态、无属性、单边..……

很多工业界的图数据库是从学术界出发的,可想而知在底层架构上面他们就会遇到各种各样的挑战,例如无法很好的应对动态的、海量的数据、无法对多边模式进行直观、便捷的数据建模(如上图所示)、包括用户体验等等。

人才很多都源自于学术界的培养,但是很多时候,象牙塔里面做了太多的假设,理论很丰富,工程能力和实践很骨感,久而久之一定会与工业界脱节。

最好的、最流行的关系型数据库不是象牙塔里面构建的,无论是从IBM的System R到后面的Oracle,还是Sun Microsystems的Mysql或者是PostgreSQL;图数据库大抵也会遵循类似的思路,工业界的解决方案更贴近应用贴近客户需求,或可在很大程度上反哺学界。

理论到实践,基本就是实验室与实际应用之间的“大不同”之所在。

·END·

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值