6月24日,为期四天的2020北京智源大会在线上圆满落幕。来自20多个国家和地区的150多位演讲嘉宾,和来自50多个国家、超过50万名国内外专业观众共襄盛会。
北京智源大会是北京智源人工智能研究院主办的年度国际性人工智能高端学术交流活动,以国际性、权威性、专业性和前瞻性的“内行AI大会”为宗旨。2019年举办了首届大会,今年为第二届,主题是“人工智能的下一个十年”。在全球抗击新冠肺炎疫情的特殊时刻,2020北京智源大会全程采用线上形式召开,与包括5位图灵奖得主在内的世界人工智能领域顶尖专家学者们通过视频相聚,共同探讨未来十年人工智能的发展走向,大力推动AI领域的国际交流合作,发挥AI抗疫的支撑作用,凝聚全球战“疫”的强大合力。
在开幕式、全体大会、闭幕式以及19个专题论坛上,大会出席嘉宾们就人工智能理论、技术和产业应用等方面,结合面临的机遇、挑战和发展趋势等发表了一系列前瞻洞见。
大会精彩瞬间:智源研究院院长黄铁军(左下)、理事长张宏江(中上)、运营副院长刘江(中下)与图灵奖获得者艾伦·凯(Alan Kay)(左上)在会上连线
为全球人工智能领域专家学者搭建前沿学术交流平台
大会开幕式上,科技部副部长李萌、北京市副市长殷勇在线出席并致辞。科技部副部长李萌在致辞中介绍了科技部在加快推进新一代人工智能规划有关任务落实中的一系列措施,包括支持北京等11个地方建设国家新一代人工智能创新发展试验区、发布《新一代人工智能治理原则》等。北京市副市长殷勇在致辞中结合新冠肺炎疫情仍在全球蔓延的新形势,认为通过召开2020北京智源大会,围绕AI未来十年发展以及“AI抗疫”、“人工智能伦理、治理与可持续发展”等问题为全球人工智能领域专家学者搭建一个前沿学术交流平台,意义十分重大。
科技部副部长 李萌
北京市副市长 殷勇
智源研究院院长黄铁军从智源学者计划、智源社区、数据中心与智能医疗、创新中心、伦理与可持续发展五个方面介绍了智源研究院最近一年多的工作进展和未来计划。
智源研究院院长 黄铁军
智源学者计划。过去的一年里,智源研究院已经遴选并支持了以“智源研究员”和“智源青年科学家”为主体的智源学者85人;新的一年,“智源学者计划”将扩充为“智源研究员、青年科学家、智源新星、智源探索者、智源博士后”五个层次,其中智源新星支持33岁以下的青年学者,智源探索者支持有意到北京发展的优秀人才,不拘一格,随进随出。研究方向上,智源研究院正在组织凝练认知神经基础、决策智能、机器感知等新方向,并对开放探索研究进行专门支持。
智源社区(baai.org)。它的目标是通过构建高度合作的人工智能社区,充分发挥成员的协同效应,建立活跃的人工智能学术和技术创新生态,并培养出下一代问题的发现者和解决者。成员在智源社区中,可以展示研究成果,探讨新发现;参与智源大会、学术报告会、主题沙龙、论文分享等活动;社区还将帮助学者、学生、开发者、创业者找到学术交流与技术合作的伙伴。
同时,本次会议中发布了智源研究院组织的两大协作成果:一是由多所高校、多位领域学者紧密协作的成果——世界首个“机器学习通用数学符号集”;二是智源与多家机构共同完成的《人工智能下一个十年》报告。
数据开放和研究工作。智源研究院围绕“开放数据”、“知识图谱”、“算法平台”三大主题,建设了面向智能医疗的数据与知识开放平台,包括:“新冠肺炎开放数据源”、中英文双语新冠知识图谱、通用智能平台CogDL等。接下来智源会基于乳腺癌数据集进行智能医疗领域联邦实验,突破医疗数据共享关键技术的研发。
智源创新中心。它的定位是通过开放智源的生态资源,支持关键核心技术攻关,推动AI原始重大创新和关键技术落地和深度应用。如围绕智源重大学术方向,支持智源学者或高校院所AI科学家的原始重大创新成果落地等。
伦理与可持续发展。目前有两项重要进展:研发了保护隐私的传染链密切接触者精准追踪系统——智源蓝保(Blue Bubble);另外,智源研究院发起成立“面向可持续发展的人工智能智库”(AI4SDGs Think Tank)和“面向可持续发展的人工智能公益研究计划”(AI4SDGs Research Program)。
AI整体发展现状及趋势
本次智源大会上,与会专家一致认为,未来十年,全球人工智能领域的专家学者将着力推动从专用人工智能(弱人工智能)向通用人工智能(强人工智能)的跨越式发展,并研究解决人工智能发展过程中面临的重大难点与挑战。其中,作为人工智能过去十年中的标志性成就——深度学习,它的发展脉络和以及所面临的挑战也是与会专家们讨论的焦点。
1. 国际顶尖科学家针对深度学习现有问题开展探索性、开创性研究
1995年图灵奖获得者曼纽尔·布卢姆(Manuel Blum)因计算复杂性理论及其在密码系统和程序检验中的应用而获奖,他在AI方面的研究主要聚焦在通过计算机模拟人脑认知和信息处理过程,结合了认知神经科学、计算机科学等,在认知计算领域具有开创性。本次智源大会上他重点介绍了一种新型的可用数学建模、可计算的机器认知模型,以帮助机器拥有意识,未来他还将在推动机器自主意识方面开展更深入的工作。
2007年图灵奖获得者约瑟夫·斯法基斯(Joseph Sifakis)因提出对人工智能模型的自动化检测方法而获奖。他在机器学习领域的研究主要集中在提升机器学习模型的可解释性,从理论层面进行分析和论证。在本次智源大会上,斯法基斯介绍了通过数学算法验证人工智能模型可信度的方法,能够推动人工智能模型在医疗、金融、国防等具有高安全性要求的领域应用落地。他认为,未来的可信人工智能应融合数据驱动方法和模型驱动方法,组成复合型系统。
2011年图灵奖获得者朱迪亚·珀尔(Judea Pearl)因在人工智能概率和因果推理研究方面取得的杰出贡献而获奖,他在人工智能领域的研究主要聚焦贝叶斯网络等结合因果推理与概率计算的人工智能算法,相比深度学习技术,能够更好地解释人工智能形成决策的原因,并将人工智能从以预测为主的应用拓展到决策与反思(即对可能情况的认知和判断)层面,具有较高的研究前景。在本次大会上,珀尔介绍了在因果推理领域的最新研究成果,推动机器因果推理从定性分析进入定量分析阶段,是人工智能、机器学习从数据驱动的统计关联分析向因果推理的一次范式转变,在思想和方法上具有变革性,为不确定性推理、决策等提供理论基础,被认为能够较好地解决机器学习可解释性不足、推理结果不可靠的问题。珀尔认为,机器因果推理目前还在不断完善和发展中,将其思想和工具用于处理复杂的预测、决策、推理等问题,是未来发展的重要方向,能够有效解决大数据环境下高噪声、高维度、弱先验等条件下的因果推理难题。珀尔称人工智能研究将很快迎来一场“因果革命”,为通往第三代(前两代分别为专家系统和深度学习)强人工智能提供了重要的理论途径。
LSTM(长短期记忆网络)提出者尤尔根·斯米德胡伯(Jürgen Schmidhuber)回顾了一系列基于LSTM的深度神经网络模型在病毒传播分析、药品设计、蛋白质折叠预测、医疗图像识别,以及语音识别,机器翻译等方面的应用,强调说明LSTM是一种通用目的模型。尤尔根·斯米德胡伯教授提出了其对AI未来的愿景:具有好奇心的人工智能,能够自我设定目标、自我学习、自我提升、实现目标,同时进一步讨论了机器学习技术如何通过自学习和强化学习等方式获得通用智能能力。
2. 人工智能应在技术发展的同时兼顾数据隐私保护
深度学习的发展依赖大规模训练数据提升模型的性能(精度),但收集大量数据会凸显数据隐私保护的问题。与会专家普遍认为,应在技术发展的同时兼顾数据隐私保护。智源研究院学术顾问委员会主席、清华大学张钹院士建议从两方面开展工作,一是建立健全数据隐私保护的相关法律法规,二是发展安全、可靠、可信和可扩展的人工智能技术。智源研究院学术顾问委员会委员、北京大学高文院士认为,应在借鉴欧美隐私保护模式的基础上,发展具有中国特色的治理模式,通过建立社会诚信机制,减少数据滥用。微众银行首席人工智能官、香港科技大学教授杨强认为,探索联邦学习等能够兼顾数据隐私保护和AI模型性能的新算法,可以进一步激励我国AI技术创新,形成基于新算法架构的人工智能范式。
AI重点领域发展现状及趋势
在研究方向上,智源研究院自2019年开始设立人工智能的数理基础、机器学习、自然语言处理、智能信息检索与挖掘、智能体系架构与芯片五大方向,目前正在组织凝练认知神经基础、决策智能、机器感知等新方向,本次大会上,围绕这些重点前沿研究方向,设立了多个专题论坛开展针对性研讨。
1. 智源研究院已布局的5大研究方向发展现状及趋势
(1)人工智能的数理基础
深度学习的可解释性、鲁棒性等问题仍是人工智能理论研究及应用落地面临的挑战。近年来,以深度学习和强化学习为代表的人工智能方法取得了颠覆性进展。与此同时,研究者们一直希望从理论上解释为什么深度学习能在各种应用场景中取得良好效果,如何从理论上保证深度网络的稳健性。本次大会“人工智能的数理基础”论坛参与专家一致认为,近年来以数学和统计学为基础的深度学习理论研究对假设要求很强,往往不符合实际情况,离真正揭示深度学习工作机制还有很大距离。尽管对深度学习的理论分析已经使用了一些数学工具,但目前仍缺乏一个统一的数学理论框架来对数据分布、模型结构以及学习方法的交互作用进行分析,对深度学习本身存在的缺陷以及改进方向也需要进行深入剖析。
人工智能的数理基础研究给多领域多学科的融合发展提供了机遇。智源研究院“人工智能的数理基础”方向首席科学家、北京大学张平文院士认为,目前关于人工智能数理基础的研究主要集中在深度学习的数学理论,未来的发展已呈现与数据科学、物理、信息及脑科学等领域融合的趋势,今后甚至可能重构应用数学。当前,人工智能的数理基础这个概念还没有一个明确的定义,在国际上也没有一个明显的领导者,正是年轻人开疆拓土的好时机,应该创造一切机会鼓励我国的青年人投身人工智能数理基础的研究。光启高等研究院副院长、香港浸会大学兼职教授季春霖从自己的研究经历中切实感受到需要把深度学习和物理模型相结合,特别呼吁建立实习生机制,鼓励学界和业界的深度交流。
(2)机器学习
机器学习将从研究人工智能算法理论的学科,向工程化学科发展。机器学习作为人工智能领域的重要分支,目前已发展成熟,以深度学习为代表的机器学习算法已全面落地应用。机器学习领军人物、加州大学伯克利分校教授迈克尔·乔丹(Michael Jordan)认为,在下一个十年,机器学习科研工作重心将从研究类人智能机器向开发建造能够处理大规模数据的智能化计算机系统转变。通过这类大型智能系统,将为人类提供更好的决策支持。机器学习研究者需要在下一个十年持续关注算法架构优化、数据样本采样、博弈论、市场设计等领域。
加强和发展机器学习的理论研究是当前迫切需求。近年来机器学习的研究已经产生了数以千计的模型、范式和优化算法,在推动机器学习高速发展的同时,也导致机器学习的理解变得困难,急需解决隐私保护、模型可解释性、泛化等问题等方面机器学习理论的不足。卡耐基梅隆大学机器学习系副主任邢波(Eric Xing)教授从损失函数、优化求解、模型体系结构和理论等方面提出了一个系统的、统一的机器学习蓝图,提供了对各种机器学习算法的全新整体理解,并给出以组合方式解决机器学习问题的指导方向。
算法突破可解决当前人工智能计算复杂度高、资源消耗巨大的发展困难。哥伦比亚大学电子工程系副教授约翰·莱特(John Wright)认为,突破传统框架的全新高效机器学习算法是当前的研究前沿,算法突破将推动新一代人工智能发展。通过针对非凸优化问题的讨论,用不依赖初始化的简单迭代方法予以解决,在天文学和计算机视觉领域亦有广泛应用。智源研究院“机器学习”方向研究员、北京大学教授林宙辰认为,在传统优化算法的适当部分引入学习机制,可以显著提高算法的收敛速度并得到更好的信息处理效果。基于学习的优化算法能够更好地适应数据,将是传统优化算法的有益补充,建议从事优化算法的研究者多加以关注。
缜密人工智能系统将建立新型人机协作关系。人工智能在科学研究生态中已发挥重要作用,但当前主要还是利用数据而不是知识。人工智能促进会(AAAI)现任主席、南加州大学信息科学研究所科研副主任尤兰妲·吉尔(Yolanda Gil)教授提出利用知识技术发展缜密人工智能系统(Thoughtful Artificial Intelligence),通过新型人机协作方式助力科学探索过程,并建议系统满足七项原则:合理性、语境性、主动性、在线性、双向性、系统性、伦理性。
(3)智能信息检索与挖掘
搜索与人工智能技术将深度结合,智能搜索要体现“以人为本”理念。加拿大皇家科学院和加拿大工程院院士裴健教授认为,搜索需要理解复杂的用户信息需求,需要大量的人工智能技术支撑,高质量的人工智能算法也需要高效的搜索算法从大规模空间中搜索到最优的参数和模型,搜索技术将在未来人工智能技术发展中扮演重要角色。同时,智能搜索不仅仅是人工智能技术的简单应用,还要考虑每一个“人”(包括老年人、残疾人等)的不同需求,需要在可解释性、文化差异、公平性、隐私保护、安全性、信息准确性、用户适应性等方面进行进一步的探索。
开放世界的持续学习具有重要价值。传统的机器学习是一个封闭式的系统,如何让机器能够在开放世界,包括训练数据未覆盖的未知世界进行探索学习,是一个很难但很有意义的问题。北京大学刘兵教授指出,持续学习的核心在于如何引导机器自发进行学习,从而使其面对未知困难时,能根据机器累计的知识,自发地解决困难。主要研究内容包括如何持续解决问题、如何进行自发的知识积累与收集、如何让机器保存记忆、如何更好地让对话参与在整个过程中等。
多模态对话式搜索将成为智能信息检索的重要研究方向。现在的信息检索工具(如搜索引擎)不能处理复杂的信息需求,迫切需要新的信息检索工具能够处理更加多样的信息(如图片、视频以及各种模态的数据等),并且能够通过多轮自然语言对话方式解决复杂信息获取问题。新加坡国立大学计算机学院的首任院长蔡达成教授认为,多模态对话和多模态推荐系统的主要技术挑战,在于多模态上下文和历史的建模,领域知识与用户模型的融合,交互方式,评价方法及数据集等。未来搜索、对话和推荐的界限将逐渐消失,融合各种技术的新的信息获取方法应该成为未来研究的重点。
(4)智能体系架构与芯片
探索合理的智能超算评测方法,推动大规模智能超算系统的健康发展。智能超算系统是支撑智能时代的重要基础设施,针对智能超算系统,传统高性能计算领域的基准测试(如Linpack)难以高效准确评估智能超算算力,而已有的人工智能基准测试程序(如MLPerf)由于规模固定、结果不直观等原因并不适合智能超算系统的评估。智源研究院“智能体系架构与芯片”方向研究员、清华大学教授陈文光认为,合理的智能算力测试程序应规模可变,具备人工智能意义及多机通信特征,同时测试结果可用单一分数表示。
智能计算系统需要系统性创新,形成长期深耕和持久发展意识。智源研究院“智能体系架构与芯片”方向研究员、中科院计算所研究员包云岗认为,智能计算系统的芯片设计是该领域的核心问题,既可以借鉴传统计算系统的设计方法(如软硬件去耦合层次化设计思想),也需要EDA(电子设计自动化)工具和软硬件协同设计平台等方面的创新,应建立贯穿研究、应用、教学、推广等环节的长期深耕和持久发展的创新意识。此外,开源已经成为芯片发展的新趋势,通过敏捷设计方法可以降低芯片设计门槛,打造开源芯片生态。
后摩尔时代的算力提升需要以新器件和新架构作为驱动力。摩尔定律带来的计算性能提升日益放缓,基于传统器件的冯诺依曼架构面临存储墙和功耗墙等问题,难以满足智能应用日益增长的算力需求,需要加快推动以神经形态计算为代表的智能体系架构发展。智源青年科学家、北京大学研究员杨玉超提出,可以利用忆阻器的动力学特性来探索新的计算应用,充分发挥神经形态硬件的优势。
(5)自然语言处理
基于深度学习的自然语言处理需要建立新的知识体系。这一轮以深度学习为代表的人工智能发展高潮,其代表性技术即为语音识别和自然语言处理。智源研究院“自然语言处理”方向首席科学家、清华大学教授孙茂松指出,在前期快速发展的基础上,目前最前沿的自然语言模型已经进化到具有1500亿个参数,但需要深入思考面向未来的发展方向。下一个十年,在大数据与富知识相结合的双飞轮驱动下,通过多模态信息融合,将建立语言处理和知识表示的新体系。
开展多模态融合和多任务学习是推动自然语言处理发展的重要方向。当前的自然语言处理研究的新趋势是进一步融合视觉、听觉、情感等文本之外的信息,交叉进行信息的对齐、互补、融合。华盛顿大学玛丽·奥斯登多尔芙(Mari Ostendorf)教授提出,要将实时物理和社交环境等多模态信息融入语言理解模型。微软亚洲研究院周明博士提出,语言+视觉的多语种多任务联合机器学习将是获得通用语义表征模型的途径。
推动大规模开源开放平台建设具有重要意义。算力、算法和数据是推动新一代人工智能发展的核心动力,此外Theaon、Caffe、Kaldi、TensorFlow、PyTorch等开源平台在人工智能发展过程中也起到了关键支撑作用。语音识别开源平台Kaldi创始人、小米集团语音首席科学家丹尼尔·波维(Daniel Povey)认为,建设下一代开源社区是重要的核心任务,将有力推动语音识别和自然语言处理技术快速发展。
2. 人工智能其他前沿研究方向发展现状及趋势
(1)机器感知
机器感知目前面临依赖大量训练数据的问题,未来将通过和神经科学等领域结合,发展模拟生物感知模式的新型算法。中国科学院计算技术研究所研究员山世光建议,应重新定义感知计算概念,确定新的研究方向。智源研究院院长、北京大学教授黄铁军认为机器感知的研究需要建立视觉信息处理新理论体系。中国科学院自动化研究所研究员王亮认为,应将融合多种感知数据,实现多模态和多机制融合的感知计算作为重点研究领域,逐步实现从感知到认知计算研究的发展进步。
(2)知识智能
深度学习无法对非结构化数据进行处理,不具备理解人类知识的能力。近年来,用于提升人工智能对知识理解和处理能力的知识智能算法发展迅速。目前,知识图谱等相关算法的性能进一步提升,呈现出和深度学习算法加速融合的态势,并逐步走向实际应用。本次大会上,加州大学洛杉矶分校计算机科学系副教授孙怡舟、微软雷德蒙德研究院高级应用科学家东昱晓等分别介绍了在知识图谱、图表示学习的最新研究成果,结果显示可显著提升算法性能表现;智源研究院学术副院长、清华大学长聘教授唐杰提出了针对图数据的机器学习算法框架CogDL;阿里巴巴达摩院资深算法专家杨红霞,斯坦福大学计算机科学副教授、Pinterest首席科学家朱尔·莱思科威克(Jure Leskovec)分别介绍了知识智能领域在智慧医疗、推荐系统等领域的应用落地情况。
(3)决策智能
决策智能是研究多个人工智能模型(智能体)相互交互学习,并采取行动的人工智能新领域。决策智能研究对推动人工智能在复杂环境下进行自主学习和决断具有重要意义,但受限于算力资源短缺、真实数据不足等问题,决策智能研究目前仍处于初级发展阶段。针对决策智能研究算力需求大的问题,清华大学交叉信息学院张崇洁教授提出,应设计一种新型算法架构,提升模型计算效率,降低对算力依赖。国际人工智能研发机构OpenAI吴翼研究员则建议,应进一步加大人工智能算力投入,推动企业和科研机构合作,加快通用人工智能等决策智能技术的研发应用。数据方面,中国科学院自动化研究所赵冬斌研究员建议通过设计虚拟环境,模拟真实条件,生成训练数据的方法,减少决策智能算法对数据的依赖。
(4)强化学习
强化学习是研究训练人工智能模型通过和环境进行交互,从中学习经验和技能的研究领域。随着算力资源的不断丰富,博弈论、控制论等学科的进一步发展,强化学习已在决策智能领域取得突破,DeepMind、OpenAI等国际人工智能研究机构研发出具备复杂环境决策能力的人工智能算法,在电子竞技中击败人类顶级选手。同时,强化学习已逐渐在智能交通领域应用落地。
未来,强化学习主要面临两方面挑战。一是训练数据不足,强化学习模型性能不佳,难以在的真实场景中应用落地,需要提升模型在数据缺失情况下的性能、安全性和可解释性。二是强化学习算力需求大,需要充足的算力资源支持。
(5)图神经网络
图神经网络结合了深度学习算法和图表示学习算法的优点,具有高性能、能够处理非结构化数据的优点,目前已进入快速发展期,出现了图卷积神经网络等一系列研究成果,并在推荐系统、信息检索、自然语言处理等领域得到应用。未来,图神经网络将和深度学习技术加快融合,结合深度学习跨领域预训练和自监督学习方法,提升在多种应用场景下的性能,以及模型的对抗攻击能力。同时,图神经网络将借鉴贝叶斯网络、马尔科夫随机场等非深度学习算法,进一步探究模型的因果推理能力。
(6)认知神经基础
深度学习具有缺乏可解释性的问题。通过研究神经科学和认知科学,通过将认知神经科学研究成果迁移到人工智能理论研究领域,有助于理解人工智能内部的计算过程,提升模型可解释性,并为发展新型人工智能算法提供理论基础。目前。北京师范大学毕彦超教授和北京大学方方教授已开展人脑视觉神经信号处理和认知模式研究,用于理解人类智能的形成机制。北京师范大学刘嘉教授提出,通过类脑与人脑双脑融合理论范式,理解智能的本质。北京大学吴思教授和中科院自动化所余山研究员提出发展脑启发的新型学习算法和网络结构设计方案。
(7)海外青年论坛
本次智源大会特设了海外青年论坛,邀请机器学习领域的青年才俊们围绕机器学习前沿研究开展研讨,包括:斯坦福大学助理教授马腾宇,杜克大学助理教授鬲融,普林斯顿大学助理教授金驰,宾夕法尼亚大学沃顿商学院助理教授苏炜杰,斯坦福大学博士后雷理骅等。与会人员们认为在机器学习领域,以下几个方面非常值得关注:
第一,元学习、自学习算法都是机器学习领域未来非常重要的研究方向;
第二,机器学习技术的优化将有利于其在数据隐私保护领域的应用;
第三,因果推断问题是人工智能领域非常重要的问题;
第四,优化算法的隐式趋势分析也是机器学习领域需要关注的研究方向。
人工智能应用及热点问题发展现状及趋势
1. 人工智能伦理、治理与可持续发展
在“人工智能伦理、治理与可持续发展”论坛上,联合国副秘书长法布里佐·霍奇希尔德(Fabrizio Hochschild)连线出席,北京市科学技术委员会主任许强出席并致辞。
法布里佐·霍奇希尔德介绍了6月11日发布的《联合国数字合作路线图》。该路线图的首要目标是“连接、尊重和保护数字时代的人们”,在全球新冠疫情大流行的当下,实现可持续和包容性复苏,推动全球数字合作,以应对在世界范围内出现的技术被严重滥用等问题,其主要内容包括推动数字通用连接,促进数字技术成为公共产品,保证数字技术惠及所有人,支持数字能力建设,建立数字信任和安全等。
联合国副秘书长 法布里佐·霍奇希尔德(Fabrizio Hochschild)
北京市科学技术委员会主任许强在致辞中指出,北京于2019年5月发布《人工智能北京共识》,为规范和引领人工智能健康发展提供了“北京方案”。智源研究院牵头建设人工智能风险与安全综合沙盒平台,对于实现人工智能“自律”“善治”“有序”起到了重要作用。和谐发展是当前人工智能伦理与治理的主旋律,应多方协作实现发展与治理双轮驱动。联合国可持续发展目标(SDG)由联合国2015正式通过,旨在从2015年到2030年间以综合方式彻底解决社会、经济和环境三个维度的发展问题,转向可持续发展道路。希望北京人工智能领域的高校院所、企业等履行社会责任,发展“面向可持续发展的人工智能”,促进全球社会、经济和环境的可持续发展,推进人类命运共同体的构建与实现。
会上,智源研究院正式发布了“面向可持续发展的人工智能智库”(AI4SDGs Think Tank)及“面向可持续发展的人工智能公益研究计划”(AI4SDGs Research Program)。智源研究院将作为管理机构执行AI4SDG公益研究计划的资助,组织全球相关专家成立顾问委员会、执行委员会,并与支持课题的共建科研机构、企业共同拟定年度资助方向并评审、并向全球发布相关课题,面向全球开放研究成果,推进全球可持续发展目标的全面实现。目前,小米、旷视、滴滴等公司积极履行社会责任,已确定作为公益研究计划的共建企业参与。
另外,参与专家针对目前全球人工智能伦理与治理面临的挑战,开展研讨,形成以下共识:
全球人工智能伦理与治理面临挑战,需要加强交流与创新合作,并在工作上有所侧重。剑桥大学未来智能研究中心主任肖恩·欧·埃格泰格(Seán ó héigeartaigh)认为,文化差异下的语言表述易产生不必要的误解而加深鸿沟。联合国副秘书长技术顾问丹尼特·盖尔(Danit Gal)建议,应加强交流、推动合作,在全球范围内倡导并激励全球合作与国际协作创新。慕尼黑工业大学AI伦理中心主任、全球AI伦理协会发起者克里斯托弗·卢奇(Christoph Lütge)建议,应在平等、公正、隐私、歧视等问题上加强人工智能监管与治理。英国阿兰·图灵研究所AI伦理负责人、联合国教科文组织人工智能伦理特别专家组委员阿德里安·韦勒(Adrian Weller)建议,人工智能面对不同种族、性别等群体时需要用不同的预测模型来解决潜在的歧视、不公平等伦理问题。
科学的人工智能伦理与治理促使高水平人工智能发展,推动人工智能实现可持续发展目标。阿德里安·韦勒(Adrian Weller)认为,在解决平等、歧视等问题的过程中,人工智能的准确度和有效性将得以提升。荷兰埃因霍芬理工大学教授、IEEE机器人与自动化学会机器人伦理委员会共同主席文森特·穆勒(Vincent Muller)认为,人工智能伦理发展促使人工智能技术前进。
2. AI创业
在“AI创业”论坛上,北京市海淀区区长曾劲出席并致辞。曾劲在致辞中介绍说,2019年海淀发布加快人工智能创新引领发展的15条措施,2020年发布了《中关村科学城新时期再创业再出发提升创新能级的若干措施》和《中关村科学城北区发展行动计划》,率先开放智慧医疗、智慧社区、科技公园等应用场景,并建设海淀“城市大脑”,同时推动公共算力平台等人工智能基础设施建设,下一步将联合智源研究院设立人工智能科学家基金,同时通过引导基金,引导创投机构投早、投长、投原创,共同培育人工智能创新企业。
参与嘉宾围绕AI投资、创业等问题开展研讨,形成以下观点:
人工智能进入赋能时代,AI创业呈现新的时代特点。人工智能发展从人工智能技术公司探索落地场景转变为传统公司主动拥抱人工智能,人工智能进入赋能时代。软件、硬件、集成和人才等方面的快速发展促使AI技术成熟周期越来越短,创业公司的技术领先窗口期越来越短,而技术产品化、商业化能力重要性不断提升。创新工场深度分析了64家欧美科技巨头的创业团队模式,其中科学家与商业合伙人的复合团队占比为80%,纯科学家团队占比为20%。创新工场创始人兼CEO李开复认为,人工智能赋能时代下,AI创业本质上做To B生意,工程型、产品型、商业型人才越来越居于关键位置。奇绩创坛创始人兼CEO陆奇认为,未来有可能成为主流产业生态的有自主系统(如自动驾驶车辆、机器人),智能场所(会形成未来新的工作与生活的时间和空间的体验),个人助手和城市大脑等。
人工智能早期应用的核心赛道是移动和云的生态。奇绩创坛创始人兼CEO陆奇认为移动和云时代是目前数字化创新的主流生态,它的数字化的能力和规模是空前的。移动和云的发展主流更是把数字化往下沉,特别是在未来10年20年,更多的云和移动时代的机会是数字化企业、数字化农业各个垂直行业。因为人工智能可以从大量现有数据当中获得知识来创造新的体验、新的价值,在移动和云的生态中将大有作为。C端(面向终端用户)人工智能在移动时代可以发挥作用的领域,包括内容制作、内容推荐、电商导购、自动定价等。
数据和场景优势在过去十年助力中国人工智能发展领先,未来将继续支撑中国人工智能创新创业发展。过去十年,中国人工智能产业蓬勃发展,创业公司数量及融资额仅略低于美国,这受益于中国独特的场景优势和数据优势。论坛专家一致认为,未来,独特的中国国情优势将继续为我国人工智能创新创业创造机会。我国政府大力推进的新型基础设施建设将为人工智能发展创造更为有利的条件,如智慧城市、智慧交通让城市和道路变得更“聪明”,为自动驾驶发展提供支持;中国制造业体量巨大,而人力成本上升和产业高端化要求将倒逼催生广泛场景智能化需求;具有后发优势的医疗、国情特色的教育等产业也有极大的智能化创业机会。
人工智能领域投资进入理性冷静阶段,人工智能创业面临多方面挑战,需各方生态合作共同推进人工智能产业发展。近两年,全球AI投资逐渐趋于理性,特别是2020年受疫情影响宏观经济下行,投资机构出手谨慎,人工智能初创企业融资困难,面临市场、资本、技术、产品和人才等多方面挑战。奇绩创坛创始人兼CEO陆奇认为,现阶段需要创业者、投资者、高校/研究机构、政府等多方共同合作,从技术赋能、资本环境、市场环境、退出环境和人才培养等方面全方位降低创业门槛,共同把握好人工智能创业机会。
3. 中英研究合作圆桌论坛
6月23日晚,英国驻华大使馆、英国阿兰·图灵研究所和智源研究院共同举办“中英研究合作圆桌论坛”(闭门会议),英国驻华大使馆科技参赞弗朗西斯·霍珀(Frances Hooper)、市科委副主任许心超出席论坛,英国阿兰·图灵研究所、剑桥大学、曼彻斯特大学等专家参与研讨。市科委副主任许心超介绍,为促进联合国可持续发展目标的全面实现,北京积极履行责任,将依托智源研究院推动成立国际性“面向可持续发展的人工智能协作网络”(AI4SDGs Cooperation Network)。该协作网络的目的是通过技术与政策研究的共享,促进可持续发展目标在全球的全面实现。将围绕“面向可持续发展的人工智能”的基础设施、可持续发展的不同议题组织跨机构的工作组,围绕AI如何推进相关议题的核心问题组织研讨、搭建开源系统、发布报告,并促进相关技术在相对不发达国家、地区的应用,以此减少数字鸿沟,增加技术的普惠程度,并实现真正意义的可持续发展。会上,许心超邀请参与研讨的阿兰·图灵研究所、剑桥大学、曼彻斯特大学等机构加入协作网络。
在人工智能伦理治理方面,智源研究院人工智能伦理与可持续发展研究中心主任曾毅介绍了“AI4SDGs Network”具体思路,并以数字安全领域的合作为切入点,探讨中英之间在数字伦理、数字安全、隐私等相关领域的合作点。针对这个话题,智源学者、北京大学副教授边凯归介绍了智源蓝保(Blue Bubble)追踪系统在隐私保护方面的探索。
在合作建设开放协同创新体系方面,智源研究院黄铁军院长,智源学者、清华大学张悠慧教授,曼彻斯特大学教授史蒂夫·弗伯(Steve Furber)探讨了在开源学习框架方面的合作,以促进实现类脑计算相关技术的突破进展。在健康领域的数据合作方面,英国图灵研究所艾伦·塞尔旺卡(Allaine Cerwonka)认为中英可以在数据的收集和使用、个人信息安全等方面开展合作,智源研究院人工智能伦理与可持续发展研究中心和新冠肺炎开放数据平台将有可能为双方的合作提供平台和支撑。
4. AI防疫
人工智能用于抗疫,应注重个人隐私保护,但更应以服务民众生命健康以及国家安全大局为重。数据和人工智能在抗疫实践当中已经发挥了巨大的价值,比如健康通行证类的应用。面对整个人类的生死存亡的时候,应以人类的疾病控制为重。
接触者追踪系统对疫情防控具有重要价值,应通过技术手段赋能个人数据保护,服务抗疫等重大突发事件。智源研究院组织研发的“智源蓝保”系统,是一个可以保护用户隐私的接触者追踪系统,面向复工、复产、复学等环境,追踪感染人员在室内的位置和轨迹,快速排查与感染者有近距离接触风险的人员,大幅降低隔离人员比例,挽回因不必要隔离所造成的人员与经济损失,该系统已申请2项专利。当前流行病接触者追踪技术依赖于收发特定的蓝牙信令,然而各个国家、各个地区没有统一的标准,导致不同追踪APP之间的信令不兼容、系统之间的数据无法打通。例如新加坡的TraceTogether应用与苹果、谷歌推广的Exposure Notification蓝牙技术框架不兼容,导致安装不同APP的设备无法相互发现,无法完成近距离追踪的任务。智源研究院已经着手牵头研究制定一个面向流行病接触者追踪技术的蓝牙信令交互通用标准。该标准兼容不同蓝牙设备类型,支持跨移动操作系统平台,独立于国外技术框架,可以在全国范围内推广,有效保护我国流行病接触者追踪系统的数据安全和用户隐私,服务社会和民众。
制约真实数据发挥更大作用的关键原因是数据零散,缺乏优质、全面的数据。现在面临难题是数据源应该到哪个地方去找,由于现在这些数据之间并没有打通,数据无法完成证实或者证伪,从而无法得到可信的结果,两个月以前美国大概有22家大数据公司要形成一个联盟,讨论要把他们的数据打通,然后把数据拿出来利用起来,美国的CDC可能有很多数据源,但是却拿不到这样高质量的数据。解决这个问题的最好办法是以一个研究目标为基础,带着目标去整合优质的数据,进而获得相应的证据。
5. AI医疗
临床同时是智慧医疗的起点与终点,研究要从临床痛点出发,并最终应用到临床上以解决根本问题。目前,智慧医疗产品涉及多种人工智能技术,面向不同病种,并已应用在部分临床上。然而,部分产品普遍出现了实验结果表现优良,但临床应用不理想的现实问题。国家神经系统疾病临床医学研究中心副主任、首都医科大学附属北京天坛医院常务副院长王拥军建议,应将临床同时作为智慧医疗研究的起点与终点,从病种的临床痛点出发,最终实现智慧医疗精准的临床落地。
医疗数据的隐私保护是所有智慧医疗研究的基本前提,临床数据安全是智慧医疗下一个亟待攻克的难题。应在实现医疗数据安全的前提下,尽量保证用于人工智能建模的数据集能反应出真实的临床特性。中国工程院院士,清华大学临床医学院院长,北京清华长庚医院院长董家鸿介绍了他们开展的一项探索性工作,基于区块链技术等安全数据共享机制,构建了国家肝胆疾病标准数据库,在实现隐私不泄露和利益共分的前提下,可支持医学教育、药界研发、临床应用的发展。
6. 智能交通
自动驾驶和车路协同前沿技术是我国智能交通发展的制高点,车路协同是智能交通发展的必经之路。中国科学院自动化研究所复杂系统管理与控制国家重点实验室主任王飞跃研究员指出我国应开发适应我国城市特定交通需求的车路协同技术,通过智能车辆载体,研究车辆无人驾驶技术,结合车路协同、车间通信构建一个车联网,提高交通系统的智能化水平,通过车辆的信息服务与车辆间通信等车联网功能优化交通流、提高交通效率、减少交通事故和节能减排。
交通大数据是智能交通发展的基础支撑,利用人工智能技术驱动交通融合发展。目前,交通数据存在信息孤、质量差、分析弱等问题。具体体现在行业数据整合不全面;不同省市交通部门之间数据没有互联互通;研究渠道不畅通,数据价值没有得到很好的发挥。北京航空航天大学杜博文教授认为利用物联网技术获取全域的城市交通数据成为可能;同时,交通大数据不仅是面向城市建设新常态的需求,也是交通服务效能提升的重要抓手。北京市交通信息中心杜勇副主任认为在业务架构层面应以智慧感知设施为基础,全面整合政府、企业、社会化数据,搭建交通大数据平台,实现交通要素的全景全量采集;在技术架构层面应搭建边、端、云为主线的系统,实现地面交通、轨道交通、运输服务等领域的端边云的数据管理体系;从实现路径上应该重塑道路资源、运输资源和城市空间资源的分配模式,实现交通运输全局优化,系统协同与智能可控。
基于广义时空数据挖掘,利用人工智能技术实现交通行为认知。现有交通系统存在多因素、散决策、强干扰等问题,且由于时空大数据的复杂时变及多元异构特点,带来如何对时空大数据进行动态认知及响应等挑战。北京航空航天大学杜博文教授提出了基于广义时空数据挖掘的交通复杂行为认知,提出将多模态交通需求量预测转化为高维时空数据预测问题,通过挖掘不同交通方式,在时间和空间维度上的关联关系,来达到联合预测的目的,以提高预测精度。
AI科学研究方面的建议
本届智源大会上, AAAI候任主席、美国康奈尔大学计算机系教授巴特·塞尔曼( Bart Selman),图灵奖得主、智源研究院学术委员会委员约翰·霍普克罗夫特(John Hopcroft),图灵奖得主艾伦·凯(Alan Kay)在与智源研究院理事长张宏江的对话中,均分别谈到了对AI科学研究方面的建议。
巴特·塞尔曼结合美国AI科研因商业导向而忽略重要领域研究的现状,建议建立一个 AI 的国家基础设施,包括共享的数据集、软件库、计算资源等等,以便那些因为资金和影响力的原因而无法获得足够资源的行业也能为 AI 的发展做贡献。
约翰·霍普克罗夫特建议用“好奇心驱动”来进行AI研究。他认为我们无法在短期内达到通用人工智能的原因,是因为目前的 AI 研究普遍是具体工程指标驱动的,人们花了很多精力,在特定的领域去改善算法的表现,但未来人工智能领域重要的突破,可能并非来自计算机科学专家,而是生物学研究者等。所以我们需要更多的好奇心驱动来进行研究。
艾伦·凯则探讨了历史上最重大的难题如何解决的机制,并提出了做出突破性研究的相关建议。他谈到,当今许世界诸多严峻挑战都是相互交织的复杂系统,如食品、气候、水资源、居住、合作、教育、生物、污染、能源、人口、权益和健康。我们无法用创造问题时所用的相同思维来解决问题。当眼前问题无法解决时,我们需要回过头来,看看那些成功的“重大挑战”是如何被解决的。必须通过发明“新层次的思维辅助工具”和更好的教育过程来促进“新层次思维”的发展,这是解决过程的一部分。他提出了做出突破性研究的19条建议:
1. 研究结果的好坏与资助者密切相关;
2. 以愿景代替目标;
3. 想象的规模应该宏大;
4. 资助人而不是项目;
5. 为发现问题提供资金,而不仅仅为解决问题提供资助;
6. 同行评议往往“太过合理”反而有害;
7. 允许失败;
8. 只资助最优秀的人和团队;
9. 形成一个研究团体,而不只是项目;
10. 培养出新人也是重要成果之一;
11. 将责任与控制分开,伟大的研究管理者和伟大的资助者同样重要;
12. 帮助青年发展,学生和实习生最终也将成为更大社区的“信使”和“合作者”;
13. 决策不应只是自上而下;
14. 训练继任者,不断从研究界引进新领导者;
15. 争辩是为了进步,而不是为了取胜;
16. 如果有能力发明和制造解决问题所需的新工具,就应该做;
17. 站在未来思考和工作,而不是从现在或过去;
18. 用30年的时间来评估一个想法;
19. 真实需求。
智源大会是北京智源人工智能研究院链接国内外人工智能顶尖、活跃学术资源,搭建前沿学术研讨的高端交流平台。第二届北京智源大会的成功召开,国内外顶级AI专家、产业领袖汇聚一堂,在把脉下个十年人工智能的核心发展路径、关键命题中的各种真知灼见,并由此开启的科研、人才培养等方面的国际交流和合作,将为北京进一步加快建设具有全球影响力的科技创新中心提供强大的助力。
关于嘉宾们演讲的进一步详细内容,我们将陆续整理推出,敬请关注。