人机共生未来可期,探索认知智能行业新趋势

0a7b6a455beffda914a0eee877e20db3.png

2021年4月10-12日,吴文俊人工智能科学技术奖十周年颁奖盛典暨2020中国人工智能产业额年会在北京和苏州同期举行。一览群智作为“第十届吴文俊人工智能科技进步奖”获奖企业,应邀在年会多个环节参加活动并发表行业观点。副总裁刘占亮在智能人机交互前沿论坛发表主题报告《认知智能行业应用的新趋势》。在报告中,刘占亮阐述了当前“AI落地难”的主要原因,结合在过去几年“深入行业”磨练出来的经验,挖掘更多发挥人工智能技术的具体场景,探索认知智能行业的新趋势。

0159c4cb605e5d2b8359a1b3683e6741.jpeg

“前所未有“的阻力

“人工智能”这个概念其实在上世纪五十年代就被提出,在过去的半个多世纪里,这个领域数次被捧上神坛,随后又跌入深谷。当我们回顾”人工智能“在这几十年里的起起落落时,我们发现人们对“人工智能”的期待是在不断改变的。

例如,在“人工智能”被定义不久之后的1968年的电影《2001太空漫游》中,人们心中的“人工智能”形象是一个拥有强人工智能的超级电脑,可以胜任一切工作。这样的期待固然很美好,但在此后的发展中,我们逐渐意识到这样“强人工智能”的遥不可及。因此,人们对“人工智能”的认知也逐步从模糊不清的理想概念向实际可用的方法论发展。

9d1bdd9b80f378febd6ee0b525e267f4.png

近年来,在算法、大算力、大数据三大要素的共同驱动下,人工智能进入高速发展阶段。随着深度学习的兴盛,不断有大规模模型被提出,“AI模型超越人类”的论调甚嚣尘上。自2018年起,人类就不止一次在多个任务榜单上被算法模型超越,这些任务中甚至有被认为需要“复杂逻辑和推理能力”的辩论赛题。

在这样的发展大潮下,“人工智能”的落地应用在一些应用场景下硕果累累,例如语音识别、人脸识别等。但是,当我们尝试把人工智能技术深入更多行业应用场景时,却遇到了前所未有的阻力。

7a1f6442dfeb33a7015e36be169c40f4.png

时间推移到两三年前,人工智能产业正呈“井喷式”发展。当“通用场景”下的诸多智能应用得到满足后,业界将很大一部分注意力转移到与行业的结合,也就是所谓的“AI + X”。

之后,人们期待人工智能被广泛应用于金融、医疗、教育等诸多行业,并希望人工智能技术能够彻底地革新这些传统,来获得效率的极大提升。此外,像工业智能制造、互联网+等领域,也获得了极大关注,人们希望这些传统工业与人工智能的融合,能够碰撞出新的风口。

此时,业界内大部分人的想法颇为理想,认为在通用领域能获得成功的算法模型,深入行业场景后只需要用同样的方法论再来一遍,就能以同样的套路解决很多行业里的问题。

而当业界诸多厂商,前仆后继深入行业之后,这样的“行业适配”热情很快就消散了,纷纷落入“人工智能落地难”的窘境。为何诸多”超越人类“的算法模型在纷繁复杂的行业场景中纷纷折戟沉沙?

当人们对”人工智能“无所不能的赞誉浪潮褪去之后,我们发现在这一轮源于“神经网络”的人工智能浪潮之下,我们缺乏对模型鲁棒性和可解释性的重视和深入探讨。此外,当我们壮志凌云般想深入行业,革新行业时,我们似乎缺乏对专业领域应有的敬畏。

走出“象牙塔”的困局

算法的鲁棒性衡量模型是否能在多种数据场景下保持一致的判断准确能力。然而,在过去几年的人工智能研究中,算法模型的鲁棒性却没有受到足够的重视。绝大部分的研究工作只能在特定语料中圈地为王,在模型的效果评测中也仅仅关心在特定测试语料上的效果。在这样的趋势下,人们对很容易对算法模型的能力高估,忽略模型达到一定效果的前提条件。

此外,对深度学习模型的可解释性的探索进展也颇为缓慢。迄今为止,大部分模型算法仍是“黑盒”,我们很难明确其中具体的过程机理。因此,我们无法清楚确定算法模型的“能力边界”。即使模型有很高的准确率,将其投入生产环境也面临着巨大风险。

例如,在医疗领域,利用计算机视觉技术来诊断癌症的模型在多年前就被提出,其准确率超过了绝大部分专业医生。但在医疗领域,癌症的诊断仍然依赖于人工。这样境况的背后正是由于模型的可解释性的缺乏,专业领域对这样的不确定性感到恐慌。由此,在很多特定的行业中,“100%确定性” 比“100%准确率”显得更为重要。

在过去几年中“深入行业”的磨砺中,AI从业者对于当前阶段的人工智能的能力开始有了清晰的认识。对于模型可解释性和鲁棒性也愈发重视。例如,自然语言处理领域顶级会议ACL 2020的最佳论文之一就提出了一套衡量模型鲁棒性的方法论。

fab02fd5d4c414f6eab8c3b28aae034e.png

然而,由于对“人工智能”的科普宣传往往“报喜不报忧”,在专业行业中从业人员对人工智能能力边界的认知仍存在很大偏差。这也是我们在进行“行业落地”过程中遇到的阻碍之一。

如何帮助模型走出“象牙塔”的困局,给自然语言处理领域在行业落地带来实质的推动,是当前AI从业者的紧要任务。与此同时,科研界开始重新思考如何评价一个算法模型,如何能降低学术产出的模型与行业场景应用之间的偏差。

而对于业界诸多AI从业者,我们需要对专业行业保持敬畏,摒弃那种“革新行业”的天真想法,探索人工智能技术是否能在专业场景中的某一环节产生精细但不可动摇的优势。也就是“人机共生”,让专业领域从业者能够切实感觉到人工智能带来的帮助,同时挖掘更多能发挥人工智能技术的具体场景。

“深入行业”的磨砺

以金融领域为例,我们能挖掘出很多“人机共生”的应用场景。在金融领域中,单据审核是一项需要耗费大量人力的工作。而单据审核却又是在诸如国际结算、外汇贸易、保险理赔等金融活动中不可获取的一部分。单据审核的过程中,需要人工根据业务规则对数十项信息进行合规性、一致性检查。这个过程是严谨的,如果出现错误判断,将产生不可估量的损失。

在这样的压力和强度下,专业人员也不免出现错误。由此,我们并不期待能使用人工智能技术完全取代票据审核的全部流程,而是挖掘其中能够自动化的步骤,并精细地设计技术模块,让金融行业从业人员能够切实感受到这些人工智能模块带来的效率提升,也让人工智能技术对人的判断进行校验。在落地应用中,这样的“人机共生”极大程度地促进了效率的提升。

此外,“人工智能落地难”的另一大原因是因为数据的缺乏。当我们准备深入一个专业领域,数据集的荒瘠是一个巨大的障碍。

6e52659219ef63fbccdfb67e4cff515b.png

以“政务领域”为例,需要将算法模型进行“行业适配”的数据门槛就不可忽视。这样的数据匮乏不仅仅受限于人力成本,更多的是来自合规性的限制。由于数据的限制,能够真正深入政务领域进行技术落地的项目乏善可陈,大部分从业者都望而生畏。

面对这样的困境,我们也彷徨犹豫过很久,无所适从。而后重新思考之后,我们转而求其次:既然数据标注是适配政务行业的巨大障碍,为什么不将人工智能技术应用于改善数据标注的效率?在我们搭建政务问答助手的项目中,绝大部分FAQ问答数据就是通过“机器生成+人工校验”的方法得到。而对于受限于“合规性”无法获得的数据,我们开始尝试使用大规模预训练语言模型进行小样本学习,将解决领域特定问题的手段转化为一种更通用的方法论。

b522f9551b41aacfdcffd2261afd3cbf.png

总之,在这一轮人工智能的兴起中,我们可喜地发现“人工智能”技术不再是空中楼阁,而能够成为了各行各业中切实提升效率的实用工具。纵然我们距离理想中无所不能的通用人工智能还有很长的路要走,但仍然对前行的路上不断涌现的技术价值充满期待。

9acf178508b9f6e93a2a714028d0a014.png

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值