Pytorch预处理和OpenCV预处理差别——transforms.Resize的坑

MidasKing

已于 2024-06-05 13:30:09 修改

阅读量8.1k

点赞数 11

分类专栏： opencv 文章标签： pytorch opencv 深度学习

于 2021-04-09 09:31:19 首次发布

本文链接：https://blog.csdn.net/IEEE_FELLOW/article/details/115536987

版权

opencv 专栏收录该内容

2 篇文章 1 订阅

订阅专栏

使用Pytorch训练通常使用Torchvision的transforms进行预处理，transforms提供了丰富的数据增强手段，但是transforms.Resize和OpenCV的resize会有一定差异，这会导致我们使用C++去部署pytorch训练的model时候可能会有一定差距，源码里面也提到过：

because PIL applies antialiasing. This may lead to significant differences in the performance of a network (https://github.com/pytorch/vision/blob/3a278d701d3a0bba25ad52891653330ece2cb472/torchvision/transforms/functional.py#L350)

因为transforms.Resize当输入为PIL图像时，默认使用的PIL的resize进行处理，除了默认的双线性插值，还会进行antialiasing，对比了OpenCV不同的resize发现，差距还是挺大的：