BP算法和RNN_模型CNN-RNN-LSTM和GRU简介

最新推荐文章于 2024-07-31 13:01:45 发布

weixin_39942992

最新推荐文章于 2024-07-31 13:01:45 发布

阅读量1.1k

点赞数

文章标签： BP算法和RNN cnn输入层 lstm不收敛 ReID中PCB模型输出维度

本文介绍了深度学习中常用的模型，包括CNN、RNN，以及RNN的变种LSTM和GRU。深度学习模型在计算机视觉等领域广泛应用，而RNN因其递归特性适合处理序列数据，但存在梯度消失问题。LSTM和GRU通过门控机制缓解这一问题，简化版的GRU在计算效率和模型复杂性上更具优势。

摘要由CSDN通过智能技术生成

深度学习自从2006年以后已经“火”了十多年了，目前大家看到的，最普遍的应用成果是在计算机视觉、语音识别和自然语言处理（NLP）。最近工业界也在努力地扩展它的应用场景，比如游戏、内容推荐和广告匹配等等。

深度模型架构分三种：

前向反馈网络：MLP，CNN；
后向反馈网络：stacked sparse coding, deconvolutional nets；
双向反馈网络：deep Boltzmann machines, stacked auto-encoders。

卷积神经网络(Convolutional Neural Network, CNN) 应该是最流行的深度学习模型，在计算机视觉也是影响力最大的。下面介绍一下深度学习中最常用的CNN模型，以及相关的RNN模型，其中也涉及到著名的LSTM和GRU。

基本概念

计算神经生物学对构建人工神经元的计算模型进行了重要的研究。试图模仿人类大脑行为的人工神经元是构建人工神经网络的基本组成部分。基本计算元素（神经元）被称为节点（或单元），其接收来自外部源的输入，具有产生输出的一些内部参数（包括在训练期间学习的权重和偏差）。这个单位被称为感知器。感知器的基本框图如下图所示。

图显示神经元的基本非线性模型，其中 1， 2， 3，... 是输入信号; 1， 2， 3，⋯ 是突触权重; 是输入信号的线性组合; φ（∙）是激活函数（例如sigmoid），是输出。偏移与输出的线性组合器相加，具有应用仿射变换的效果，产生输出。神经元功能可以用数学表示如下：