Tensorflow2.* Keras 视频5维输入 shape调整 tf.reshape()

最新推荐文章于 2023-03-09 20:08:25 发布

老光头_ME2CS

最新推荐文章于 2023-03-09 20:08:25 发布

阅读量1.4k

点赞数

分类专栏： Tensorflow 学习笔记计算机视觉卷积神经网络文章标签： tensorflow 深度学习 python

本文链接：https://blog.csdn.net/Forrest97/article/details/106878419

版权

视频输入问题

传统的图像网络的输入数据格式input_shape =（batch, h, w, c），但对于视频输入（batch, number_frames, h, w, c）。我们在keras建模的时候batch_size默认为input_shape[0]，无法改变，同时keras.layers.Conv2d等层操作也是按照4维张量处理输入输入。

解决方案一：维度切片堆叠（不推荐）

在模型搭建的过程中，在number_frames维度进行堆叠，即在喂给keras.layers.Conv2d前将数据按number_frames维切片，输出后再进行堆叠。

    for ii in range (input_shape[0]):
        if ii==0:
            coarse_out=coarse_model(videoclip_cropped[:,ii])
        else:
            coarse_out=concatenate([coarse_out,coarse_model(videoclip_cropped[:,ii])], axis

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

老光头_ME2CS

关注关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
Tensorflow2.* Keras 视频5维输入 shape调整 tf.reshape()

视频输入问题传统的图像网络的输入数据格式input_shape =（batch, h, w, c），但对于视频输入（batch, number_frames, h, w, c）。我们在keras建模的时候batch_size默认为input_shape[0]，无法改变，同时keras.layers.Conv2d等层操作也是按照4维张量处理输入输入。解决方案一：维度切片堆叠（不推荐）在模型搭建的过程中，在number_frames维度进行堆叠，即在喂给keras.layers.Conv2d前将数据按nu
复制链接

扫一扫