当人们需要在自动驾驶或医疗诊断等与人类健康和安全密切关联的领域做出决策时,深度学习神经网络人工智能系统可以提供重要的决策信息。但是如何判断这些信息的正确性?
来自麻省理工学院CSAIL的Alexander Amini和他的同事开发了一种能够让神经网络快速处理数据的算法,这种算法不仅可以输出预测,还可以基于可用数据的质量输出模型的置信度。
这种算法上的进步可能会挽救生命。举个例子,当一辆汽车通过十字路口时,在该算法的帮助下,机器可以计算出“可以通过十字路口”和“可能过不去,停车以防万一”之间的区别。
目前,用于神经网络不确定性估计的方法往往价格昂贵,而且对于瞬间决策的计算相对缓慢。但是Amini等人发明的“深度证据回归”算法可以提升瞬间决策的速度,并能促进更为安全的结果。
Amini说:“我们不仅需要提升模型的性能,还需要了解我们什么时候不能信任这些模型。”“通过估算学习模型的不确定性,我们还可以了解模型会带来多少误差,以及哪些缺失数据可以改善模型。”
有效的不确定性分析
在经历了跌宕起伏的发展之后,深度学习表现出了卓越的性能,在某些情况下其学习结果甚至超过了人类的准确性。
“神经网络在99%的情况下都知道正确答案。”Amini说,“我们真正需要关心的是剩下的1%,以及我们如何可靠、有效地检测到这些情况。”
要重视神经网络不确定的1%
此前,科学家们通常会根据贝叶斯深度学习的方法分析不确定性。这种方法需要多次运行神经网络并多次采样,该过程需要大量时间和内存,所以这种方法在信息流高速产生的时代并不适用。
Amini和他的同事设计了一种通过神经网络一次运行即可估算不确定性的算法。“深度证据回归”的方法具有大量输出的网络,不仅可以生成决策,而且可以产生一个新的概率分布,捕获支持该决策的证据。
这种分布被称为证据分布,直接反映了模型对其预测的置信度。
置信检验
为了检验新方法的有效性,研究用人员设置了一项具有挑战性的计算机视觉任务。在这项挑战中,神经网络需要分析一幅单目彩色图像,并估计每个像素的深度值,即到相机镜头的距离。
这一挑战是在模仿现实生活中的自动驾驶场景,自动驾驶汽车可能会使用类似的计算来估计其与行人或车辆的距离。
测试结果符合研究人员的期望,该算法不仅成功预测了错误识别的概率,并且对神经网络产生的错误进行了校准。研究人员发现神经网络对“分布外”的数据反应敏感,进行了更细致的不确定性分析。
在另一项试验中,研究人员提高了一批图像中的噪音水平。在“深度证据回归”的助力下,神经网络成功识别出了这些图像。这种对伪造数据发出预警的能力能够有效阻止对抗性攻击。
深度证据回归可以提高人工智能辅助决策的安全性。Amini说:“任何领域的机器学习,都需要具有不确定性意识。”
参考:
1.https://www.sciencedaily.com/releases/2020/11/201119144511.htm
2.https://news.mit.edu/2020/neural-network-uncertainty-1120