自定义collate_fn函数：应对报错RuntimeError stack expects each tensor to be equal size

2401_83816838

于 2024-04-11 19:51:31 发布

阅读量964

点赞数 3

分类专栏：程序员文章标签： python 深度学习开发语言

本文链接：https://blog.csdn.net/2401_83816838/article/details/137650792

版权

此时就需要自定义collate_fn函数实现数据的自定义加载功能，下面首先看一下装入Dataset中的数据是什么：
在这里插入图片描述
可以看到：这里的batch是一个批量的数据，这和超参数batch_size大小相关联。它是一个list类型的数据，其中每一个元素是一个包含了(数据1,数据2,...,数据n,label)形式的元组，例如：

这里数据个数n取决于你的Dataset中究竟是什么样的数据。以这个项目为例，这是一个多模态虚假新闻检测的例子中生成的数据，其中下标为0的数据是我们根据一张图片检测后形成的锚框以及整张图片的feature两者concat形成的特征值。具体可见下面代码段：

class UEMDataset(Dataset):
    def \_\_init\_\_(self,df,root_dir,image_id,text_id,image_vec_dir,text_vec_dir):
        # super(UNDataset, self).\_\_init\_\_()
        self.df = df
        self.root_dir = root_dir
        self.image_id = image_id
        self.text_id = text_id
        self.image_vec_dir = image_vec

最低0.47元/天解锁文章

2401_83816838

关注

3
点赞
踩
6

收藏

觉得还不错? 一键收藏
0
评论
自定义collate_fn函数：应对报错RuntimeError stack expects each tensor to be equal size

取决于你的Dataset中究竟是什么样的数据。以这个项目为例，这是一个多模态虚假新闻检测的例子中生成的数据，其中下标为0的数据是我们根据一张图片检测后形成的锚框以及整张图片的feature两者concat形成的特征值。以上就是用来生成数据的Dataset类，但是这里有一个问题：如何区分训练集和测试集数据，此时就需要借助你的数据样本了。一般的数据样本是分为两个文件存储的，这里的两个文件分别是下图中的。可以看到：这里的batch是一个批量的数据，这和超参数。读取两者的数据，分别装入两个。
复制链接

扫一扫