输入输出 每一个输出后接一个全连接层。 结构及其推导 参数量 每一个LSTM单元都有4个网络前馈层,分别代表3个门控单元,输入和隐含层h直接concact(相加),后与权重矩阵相乘,还原成相应的维度。激活函数作用于整个矩阵,参数量要加上偏置,此外输出一般有一个全连接层的参数(需要注意)。 矩阵乘法点积(符号为圆圈内加一点) 和向量点积不一样