Hacker's guide to Neural Networks
原文链接:
http://karpathy.github.io/neuralnets/
写这篇文章时,作者是斯坦福的计算机博士,师从李飞飞。深度学习作为作者研究的一个主题,已经有几年时间,这篇文章从最基本的原理讲起,非专业人员阅读后,应该对神经网络会有原理性的认知。
我个人对于神经网络的经验是,当我开始忽略整页的密密麻麻的后向传播的推导公式,仅仅开始写相关的代码时,一切都变得异常清晰了。因此,本教程将包含非常少的数学相关内容(我不相信它是必须的,并且有时它反而让简单的概念变得让人迷糊【看来博士也嫌麻烦】)。由于我的专业背景是计算机科学和物理学,因此我将从标题中骇客的视角来开发每一个相关的主题。我的阐述将会围绕代码和物理常识展开,而不是数学推导。基本上,我会力图以我刚开始遇到的方式来展示算法。
“当我开始编码的时候,一切都变的异常清晰”
你可能期望能够立即学习神经网络,后向传播,以及如何将它们应用于实际的数据集,等内容。但是,在学习这些之前,我希望大家忘记这些名词,内容。让我们回过头来,理解一下核心的机理。首先,谈谈实值电路。