LawsonAbs的认知与思考,还请各位读者批判阅读。
总结
- 这个是 pytorch 中的类,所以可以去 torch的在线doc中查找相关的资料
- 持续更新~
1 Dataset
pytorch中的数据类都要继承这个类,同时,必须实现方法__len__()
和 __getitem__()
。
2 DataLoader
上面的Dataset
只能是得到单个样本,但是单个样本就进行一次训练,是太低效了,所以就可以尝试进行batch处理。这个DataLoader
就是用于将得到的单个样本组合成batch 的操作。
2.1 参数详解
collate_fn参数:
只有当dataset是 map-style 的时候,那么就可以使用这个 collate_fn() 来对数据进行合并操作成为一个mini-batch。