Fixing the train-test resolution discrepancy 文章解读总结

最新推荐文章于 2021-11-08 16:47:21 发布

sunny_develop

最新推荐文章于 2021-11-08 16:47:21 发布

阅读量1.1k

点赞数

分类专栏：深度学习文献文章标签：深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/guanyuqiu/article/details/107987275

版权

深度学习同时被 2 个专栏收录

10 篇文章 0 订阅

订阅专栏

9 篇文章 0 订阅

订阅专栏

《Fixing the train-test resolution discrepancy》是最近在Imagenet上分类最好的算法模型，文章主要是针对训练的策略和预处理方式进行了改进。

具体的实现方法是用小分辨率的图片训练模型，之后用稍大的分辨率的图片微调模型。

图像分类的预处理，首先对图片进行裁剪，裁剪后对图片Resize后送入模型进行训练，而裁剪不同分辨率的图片块会对模型产生很大的影响，在训练和微调时作者采用不同的处理方式，训练阶段作者采用RandomResizedCrop,微调时采用CenterCrop；

微调只训练模型的全连接层；

具体实验过程：

训练阶段：图像增强方式：horizontal flip，random resized Crop， color jittering；

微调阶段：图像增强方式是把数据分为三部分进行增强：

第一部分是把测试图片resizing后center Crop；
第二部分是把测试图片Resize后，random horizontal shift of the center crop, horizontal flip and color jittering;
第三部分是训练时增强后的训练数据直接拿过来

文章中作者也提到为增加准确率，作者对几种分类模型的结果取平均来分类预测；

这是我基本上get到的信息，文章中对图片不同分辨率对模型的影响进行了细致的阐述，感兴趣的可以直接阅读原文。

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

sunny_develop CSDN认证博客专家 CSDN认证企业博客

码龄14年

54: 原创

7万+: 周排名

47万+: 总排名

34万+: 访问

: 等级

2958: 积分

124: 粉丝

193: 获赞

112: 评论

912: 收藏

私信

关注

热门文章

分类专栏

文献 9篇
深度学习 10篇
语义分割 1篇
背景建模 3篇
目标跟踪 5篇
目标分类 4篇
图像增强 3篇
红外摄像 3篇
图像处理基础算法 9篇
python 12篇
Matlab 1篇
C++ 8篇
机器学习 7篇
caffe 1篇
tensorflow 1篇
目标检测 3篇

最新评论

机器学习笔记——ROC曲线
rann2: 感谢！非常详细！
《BBN:Bilateral-Branch Network with Cumulative Learning for Long-Tailed visual Recognition》简读
GG_B这孩子打小就聪明: 你好大佬，我想问一下，训练阶段，它不同的采样器采到不同的样本，最后在累计学习部分合起来分类，两个样本的标签不一样怎么分类的。感觉怪怪的。如果是同一个样本，不同的采样器又感觉没有意义了，刚看到这个论文，想借鉴，但是卡在这里，希望您可以解答。十分感谢！
Lime 代码
广东中学生: if __name__ == "__main__": result = model() result.load(os.getcwd()) # for i in range(4,5): # img = os.path.join(os.getcwd(),"miccai/{}.png".format(i)) # img = cv2.imread(img) # print("{}类别的预测结果为：{}".format(i, result.predict(img))) img = cv2.imread(os.path.join(os.getcwd(),"miccai/4.png")) explainer = lime_image.LimeImageExplainer() # 将input_image转换为RGB格式 input_image_rgb = cv2.cvtColor(img, cv2.COLOR_BGR2RGB) input_image_rgb = np.array(input_image_rgb) predict_fn = lambda x: result.predict(x) print(result.predict(input_image_rgb)) explanation = explainer.explain_instance(input_image_rgb, predict_fn, labels=[4]) temp, mask = explanation.get_image_and_mask(explanation.top_labels[0], positive_only=True, hide_rest=True) cv2.imwrite('lime_output.png', temp) 代码如上result.predict(input_image_rgb)返回的结果就是这张图对应每个分类的得分，一个一维数组
Lime 代码
广东中学生: 你好，我的预测函数返回的是该图每个分类的得分，也就是一个一维数组，其他地方都和你一样，但是为什么我运行代码之后会提示报错，希望您看到后能帮忙回复一下，因为我已经找了一天的解决方案了： Traceback (most recent call last): File "python-process/miccai/model.py", line 187, in <module> explanation = explainer.explain_instance(input_image_rgb, predict_fn, top_labels=5) File "anaconda3/envs/pytorch/lib/python3.7/site-packages/lime/lime_image.py", line 219, in explain_instance feature_selection=self.feature_selection) File "anaconda3/envs/pytorch/lib/python3.7/site-packages/lime/lime_base.py", line 182, in explain_instance_with_data labels_column = neighborhood_labels[:, label] IndexError: too many indices for array: array is 1-dimensional, but 2 were indexed
高动态范围红外图像压缩
ljl834830593: 你好，请教一下GF&DDE，834830593@qq.com

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。