有意思的是,这个模型里图像特征只使用一次,图像的抽象特征只会传输给第一个LSTM模型中 用了比普通RNN更厉害的LSTM做RNN的基本单元,用LSTM生成文本 图像特征使用了更强大的CNN 和EncoderDecoder模型完美契合 都是只将图像特征给一个网络