甘利俊一 | 信息几何法：理解深度神经网络学习机制的重要工具

智源社区

于 2021-06-30 18:09:16 发布

阅读量1.8k

点赞数 3

文章标签：网络神经网络算法 python 计算机视觉

本文链接：https://blog.csdn.net/BAAIBeijing/article/details/118384044

版权

本文介绍了信息几何法在理解深度神经网络学习机制中的重要性，回顾了反向传播算法的历史，以及统计神经动力学在深度学习理论中的应用。甘利俊一教授的演讲阐述了如何利用统计神经动力学研究深度随机网络，揭示深度学习在参数量远大于训练样本时仍能有效学习的理论基础。

摘要由CSDN通过智能技术生成

智源导读：深度学习的统计神经动力学主要涉及用信息几何的方法对深度随机权值网络进行研究。深度学习技术近年来在计算机视觉、语音识别等任务取得了巨大成功，但是其背后的数学理论发展却很滞后。日本理化所的Shun-ichi Amari先生（中文：甘利俊一）近期在北京智源大会上发表了题为《信息几何法：理解深度神经网络学习机制的重要工具》的演讲。在演讲中，甘利先生梳理了人工神经网络研究的部分重要历史事件，分享了近两年在深度学习理论的一些最新研究成果，指出统计神经动力学方法可以为理解深度学习提供重要的理论工具。

整理：邹晓龙、陈智强

Shun-ichi Amari是日本理化所的荣休教授，神经网络研究的教父级人物，一生做出了大量开拓性的成果，包括独立发展了信息几何（Information Geometry），首次提出了随机梯度下降算法（1967）、连续吸引子神经网络（1977）、Amari-Hopfield模型、nature gradient等。

反向传播算法的历史