美军的AI发展计划研究(2)

数据猿报道

MIT训练出了一只变态、罪恶、极度阴暗的人工智能

 

大数据产业创新服务媒体

——聚焦数据 · 改变商业

接上文:这里

AI技术和能力的最新发展

支持人工智能(AI)的技术有很多种,如机器学习(ML),这是计算机科学(CS)的成熟领域,根据统计和优化的深厚技术,可以建立数据的行为模式。在过去10年,ML某些子领域(尤其是深度学习)的技术进步快速。深度学习(DL)采用多层神经网路模型,学习复杂的数据,这种演算法的设计和部署,通常包括一个训练阶段和一个推理阶段。训练阶段包括解决优化问题,根据某种学习准则,使模型符合最佳训练数据;推理阶段则在新数据中,使用训练后的模型查找相似行为模式。

由于这些模型的复杂性,训练阶段通常需要庞大且经标记的数据集,以及强大的计算能力,而推理阶段所需的计算能力需求则低很多。通常这不是一次性的线性过程,而是一系列反覆进行训练与推理阶段,以增强甚至维持演算的效能。由于监督式机器学习(使用标记数据集来训练模型技术)的长足进步,进而导致分类和预测的任务能力取得突破性进展。众所周知的图像分类案例,就是以Image Net数据集为基础的大规模视觉识别竞赛。除图像处理外,这些进步还促使语音和自然语言处理的重大突破,随后运用在机器翻译和文档分类等领域。最新的突出发展,就是深度强化学习(DRL)。

强化学习(RL)是一项古典研究领域,其核心是以近似解决处理具有递延奖励的顺序决策问题。由于DL技术有望提供这些近似解决方案,因此在最近几年,重新引起人们关注。DRL在策略游戏方面也带来新突破,例如演算法被运用在围棋和星际争霸II等即时人机对决中,AI系统击败世界级冠军。尽管这些进展令人兴奋不已,但值得一提的是,著名学者也提出相关警示。

美国防部AI的风险和挑战

根据最新AI技术发展所提出的问题是:这些最新AI技术如何强化美军能力及扩大部署运用?从技术角度来看,这些问题的答案是多数企业型AI应用软件目前对美国防部而言,仍是微不足道的成果,且大多数任务支援型的部署运用,尤其是作战型AI系统仍是遥遥无期。此外,部署和扩大运用这些先进技术正面临各种挑战和风险,先进技术对企业型、任务支援型和作战型的AI系统而言,也呈现出不同的发展趋势。此文要强调的是,提出这些问题并不意味着AI只是深度学习或深度强化学习;相反,正如前所述,很多技术方法都可用来支持AI。

企业型AI应用软件相对成熟

美国防部使用的多数企业型AI应用软件,在许多方面可与民间和公部门现行AI解决方案相提并论。因此,现有商业解决方案及其成功案例,已证明可运用类似技术解决方案、定制,或专门研发满足美国防部的作战需求。尽管目前有些企业型AI应用软件的技术已存在且相对成熟,但这并不表示在整个组织推广运用时,不会遇到障碍和困难。

相对来说,扩展AI需要定期对现有技术解决方案进行确认,以及律定投资方案的优先顺序,进而大幅改善组织作业能力,或其他关键目标的达成。一旦确定优先投资领域,扩大运用AI要采取购买商业版或内部研发的解决方案,则需要明智的抉择,还要考量维持组织的专业知识和技术能力,以及确保支援这些解决方案的基础设施可用性。同时,扩大规模需要激励潜在用户群的使用率,并提供所需技能培训。最重要的是,扩展AI需要了解关键资源数据,透过系统性收集与管理数据,在组织内共享数据以支持目标达成。

此外,当前AI技术(尤其是深度学习)大量依赖干净且带有标签的训练数据。可用数据的质量和数量,通常会影响AI的方法,以及应用深度学习技术的可行性。更多数据将允许更多方法的运用,同时需要基础设施支援数据的存储、管理和处理需求。尤其是,在组织中大规模部署企业型AI,需要与负责数据和管理数据的实体部门,以及那些负责存储和计算基础设施的部门密切合作。它还需要与用户紧密合作,以即时发现及解决最重要的问题。再者,AI工具都是以数位方式来设计和实现,因此,AI的成功需要软件的成功,尽管后者的成功远不足以确保前者的成功。

深度学习演算法缺乏完整性

任务支援型和作战型AI是美国防部最重要的应用需求。例如深度学习在图像目标识别方面的最新成功技术,使情监侦(ISR)成为任务型AI的当然应用领域。尽管有许多令人鼓舞的技术突破和成功案例,但深度学习演算法仍是片断脆弱且缺乏完整性。此外,深度学习演算法的设计,目前仅针对商业用途进行优化,而不是针对国防部的各种任务需求。

针对商业应用优化的性能指标,通常不符合国防部的作战需求。对于战场环境而言,除缺乏大型训练数据集外,合成数据的可行性也尚待观察。最后,技术专家一直强调深度学习技术是依个案而定,因此不易推广到其他应用程式。也就是说,在一个应用程式上运行良好的演算法,无法确保在另一个应用程式上也能运作无误。

确认、验证、测试和评估关键挑战

对所有类型AI的严峻挑战,就是AI的确认和验证,其配套措施就是测试和评估,此挑战对以安全为优先考量的任务支援型和作战型AI系统而言尤为明显。确认与验证程序,使系统设计人员能够信任其设计,而测试与评估,能使管理者能够评估系统是否满足所指定的需求,对其他利害关系者(例如用户和操作员),则可建立对系统的使用信心。

当前AI的确认、验证、测试和评估(VVT&E)程序,远远不能确保AI应用软件的性能和安全性,特别在涉及安全关键系统情况下。安全关键控制系统的确认与验证,是当前研究主题,通常涉及形式数学分析或广泛模拟。前者虽优雅高尚,但缺乏扩展能力,且后者在理论上则难以支持结果的信心。两者所代表的内容也都有其局限性,因此可能会错过现实世界中的某些关键要素,进而导致性能下降,或在实际运作时出现差错。此外,机器学习和相关方法还涉及很多复杂因素,除模型的验证外,还需验证训练数据的合理性。

注:本文来源于公开网络

——END——

2019数据猿年度榜单:

2019大数据产业趋势人物榜TOP 10

●2019大数据产业创新服务企业榜TOP 15

●2019大数据产业创新服务产品榜TOP 40

【精彩预告】

 

数据猿即将推出“2020上半年度大型主题策划活动——我的产品观”,敬请期待!

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值