(关注 AI新视野 公众号,发送‘资料’二字,免费获取50G人工智能视频教程!)
递归神经网络的图解指南:直观理解
如果你想学习机器学习,理解递归神经网络这一强大技术非常重要。 如果你使用智能手机或经常上网,你很有可能已经使用过应用了RNN的应用程序。 递归神经网络用于语音识别,语言翻译,股票预测; 甚至用于图像识别来描述图片中的内容。
网上已经有许多关于递归神经网络的指南,本文通过分享插图以及解释我是如何理解它的。 我将避免所有数学公式,而是专注于RNN背后的直觉。 在这篇文章的最后,希望你应该对RNN有一个很好的理解,并有所启发。
序列数据
RNN是神经网络,擅长建模序列数据。 要理解这意味着什么,让做一个实验。 假设你拍摄一张移动的球在时间上的静态快照。
此时你想预测球的移动方向。 因此,当你只有在屏幕上看到的信息时,你将如何做呢? 可以继续猜测,你提出的任何答案都是随机的猜测。 如果不知道球的位置,就没有足够的数据来预测球的位置。
如果你连续记录球的位置的许多快照,你将有足够的信息来做出更好的预测。
所以这是一个序列,一个特定的顺序,一个跟着另一个。 有了这些信息,您现在可以看到球向右移动。
序列数据有多种形式。 音频是一种自然序列, 你可以将音频频谱图分成块并将其输入RNN。