ConvLSTM Pytorch学习笔记（一）

最新推荐文章于 2024-06-11 10:00:27 发布

桑乐渝

最新推荐文章于 2024-06-11 10:00:27 发布

阅读量2.2k

点赞数 4

分类专栏：机器学习文章标签： python 神经网络 lstm

本文链接：https://blog.csdn.net/weixin_45015397/article/details/123560337

版权

机器学习专栏收录该内容

1 篇文章 0 订阅

订阅专栏

上周主要工作是跑通ConvLSTM网络，原先找到的代码是基于pytorch的，但是在调试的过程中遇到了几个问题，内存不够，后来换服务器跑也跑不通，考虑代码本身问题，后来尝试了一下基于Keras的ConvLSTM网络，发现接受一个新网络和新的代码形式更痛苦（调了两天左右，问题一直停留在数据集加载的问题），而且问题更多，于是决定继续回归基于pytorch。在调试过程中，遇到以下几个问题：

问题一：得不到想要的输出

在经过图片维度调整之后可以得到上述这样的结果，发现第一列对应的结果不对劲，按理说应该是batch_size的值，但得到的记过确实步长（这里步长表示图片帧数，由于只有一张图片，因此为1。），回溯后发现问题出在构建网络的时候batch_first=True，这里由于输入图片的时候不是将其放置在第一位，为此将这个值改成False。但是到底哪个才是最终的输出呢，又重新回过头看了一遍传统LSTM、卷积ConvLSTM网络的定义，发现了一个点，在经过LSTM和卷积ConvLSTM网络后得到的是最后一层的隐藏层h的输出结果，这并不能得到我们想要的分类结果，为此需要在网络的最后添加一个全连接层，进一步做维度变换，从而得到想要的分类结果。 LSTM输出的向量的维度是指定的units，但是最后在计算损失的时候是用的标签，标签也是向量，但是标签的向量维数和units不一致，这样就没有办法计算损失了，所以要加一个Dense将输出的向量转换成标签向量的维度，这样就可以计算损失了。如下图所示，一个完整的神经网络流程大概是这样的。网络已经调通了，证明这个代码是可行的，但是问题是还得不到分类的结果。

问题二：得到的输出维度不对

继续前进，我要把分类结果弄出来。

具体的问题是出在，从ConvLSTM网络得到的输出结果无法直接与全连接层相连，所以需要将输出的张量降维处理得到目标张量，由于经过ConvLSTM得到的结果是一个四维的张量，所以运用pytorch的骚操作h[:,-1,-1,:]将其中的两维删掉，通过这样处理之后就可以了，网络继续运行。

问题三：得到的结果不对

成功了可以正常运行了，但是问题是解决不完的。准确率居然一直都徘徊在24%，这这这一定是出了点什么毛病。猜想是网络的输出我对应错了，所以这里我要回归一下输出的数据与传统的LSTM网络的输出结果相比对，尽量靠紧一点。

桑乐渝

关注

4
点赞
踩
11

收藏

觉得还不错? 一键收藏
1
评论
ConvLSTM Pytorch学习笔记（一）

上周主要工作是跑通ConvLSTM网络，原先找到的代码是基于pytorch的，但是在调试的过程中遇到了几个问题，内存不够，后来换服务器跑也跑不通，考虑代码本身问题，后来尝试了一下基于Keras的ConvLSTM网络，发现接受一个新网络和新的代码形式更痛苦（调了两天左右，问题一直停留在数据集加载的问题），而且问题更多，于是决定继续回归基于pytorch。在调试过程中，遇到以下几个问题：问题一：得不到想要的输出在经过图片维度调整之后可以得到上述这样的结果，发现第一列对应的结果不对劲，按理说应该是b.
复制链接

扫一扫