整体框架(方法)
这篇文章主要阐述怎么从一张图中获取到一张比较好看的crop的图。大致的流程图如下所示:
文章的亮点
文章中可以借鉴的地方主要在于文章中汲取传统数字图像处理的方法。
最典型的莫过于soft binarization layer:
通过这个layer,可以增强salient feature map。效果如下所示:
可能的 优化方向
这篇论文提出了一种智能crop的方法,但是却存在如下的不足:
1、模型所占内存过大,训练好的模型大小达到1G左右的大小;
2、模型前向推理时间有待优化;
3、有没有更好的pipeline?
4、精度能否进一步提升?
关于第一二点可以参考文献[1]