论文不详细解读（二）——SimCLR系列

最新推荐文章于 2024-04-18 14:23:18 发布

一豆豆酱

最新推荐文章于 2024-04-18 14:23:18 发布

阅读量894

点赞数

分类专栏：论文笔记文章标签： SimCLR

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_44965314/article/details/131322959

版权

1. SimCLR v1

论文名称： A Simple Framework for Contrastive Learning of Visual Representations
开源地址：https://github.com/google-research/simclr
大佬论文解读：https://zhuanlan.zhihu.com/p/378953015

highlight：更多的数据增强与非线性映射层
用数据增强构造正样本，batch内的其余图片为负样本
在这里插入图片描述

假设现在有1张任意的图片x，叫做Original Image，先对它做数据增强，得到2张增强以后的图片x1和x2。注意数据增强的方式有以下3种：

随机裁剪之后再resize成原来的大小 (Random cropping followed by resize back to the original size)。
随机色彩失真 (Random color distortions)。
随机高斯模糊 (Random Gaussian Deblur)。

SimCLR框架
在这里插入图片描述
使用 Projection head 计算loss，预测头是一个2层的MLP，将2048 维的visual representation向量进一步映射到 128 维隐空间中，得到新的representation。最终使用 $z_i$ $z_j$

最低0.47元/天解锁文章

关注

0
点赞
踩
5

收藏

觉得还不错? 一键收藏
1
评论
论文不详细解读（二）——SimCLR系列

1）Encoder 变长变大：SimCLR v2 用了更大的ResNet架构，把原来的 ResNet-50 (4×) 拓展成了 ResNet-152 (3×) 和 selective kernels (SK)，记为 ResNet-152 (3×+SK)，变成这样以后，把这个预训练模型用 1%的 ImageNet的标签给 Fine-tune 一下，借助这一点点的有监督信息，获得了29个点的提升。假设现在有1张任意的图片x，叫做Original Image，先对它做数据增强，得到2张增强以后的图片x1和x2。
复制链接

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。