来自官网的DataLoader说明:
翻译:合并样本列表中的样本以形成一个最小batch的张量,从映射函数样式数据集中使用批量加载时使用。
个人理解呢,就是从样本列表中过来了一个batch的数据,经过映射函数,形成一个tensor。
collate_fn这玩应就是一个映射函数,输入是一个batch的样本,输出是一个tensor。有系统默认的,当然这个位置作为一个参数被暴露出来的意思就是你可以自己定义一个映射函数来代替它。
实现功能:
以一个例子来具体的看一下collate_fn的功能:
系统默认collate_fn:
复现collate_fn:
从此图中可以看出,自定义的collate_fn函数已与系统默认的collate_fn函数输出结果相同。
无转tensor:
从此图中可以看出,数据输入到默认collate_fn函数中,首先被转为tensor。
无转tensordataset:
从此图中可以看出,数据输入到默认collate_fn函数中,被转为tensor后又被转为tensorDatasets。
未尝试部分:
可以看出collate_fn中应该有代码来处理数据总数无法被batch整除的情况。
YOLOv3中collate_fn:
从代码中可以看出,自定义的函数,主要功能就是拼接。
源码:
参考链接:https://blog.csdn.net/weixin_42028364/article/details/81675021