1.PyTorch团队重写「SAM分割一切」模型,比原始实现快8倍(附源码)
摘要:
本文介绍了PyTorch团队重写「SAM分割一切」模型的加速方法。通过使用Bfloat16半精度、GPU同步和批处理等技术,以及Torch.compile编译器和SDPA(Scaled Dot Product Attention)等特性,他们成功地提高了SAM模型的性能。
感想:
SAM模型在端侧落地的一个大突破?
需要确认下其在训练和测试场景的加速效果。
2.还是那头痛的 Resize
摘要:
这篇文章讨论了在深度学习中使用的图像Resize的问题,特别是比较了Pillow和OpenCV库在Resize操作上的差异。作者发现Pillow的Resize采用了一种双线性插值的方法,与OpenCV的四点取值方式不同,导致两者结果不完全对等。为了解决这个问题,作者在C++部署中找到了一个基于OpenCV的现成解决方案。另外,文章也提到了舍入操作的差异,需要注意Python和C++之间的一致性。
感想:
上次我记得review时提到这个问题。opencv和pillow的resize实现不一样,如果在C++和python中用了不同的接口,可能导致效果差异的。C++ pillow resize可以用开源库https://github.com/zurutech/pillow-resize