第六十一周周报

童、一

已于 2023-11-11 07:54:03 修改

阅读量307

点赞数 2

文章标签：人工智能

于 2023-11-11 01:36:36 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_44432831/article/details/134337732

版权

学习目标：

代码

实验

论文

学习时间：

2023.11.4-2023.11.10

学习产出：

代码

1、修改CelebA64数据集的代码，实验暂时没跑完
2、添加CB模块，实验暂时没跑完
3、修改ViTGAN的CIPS Generator位置编码为傅里叶编码

实验

1、消融实验调整顺序还在进行中
2、相对位置编码出了一个新结果但还是没傅里叶编码好
3、cifar100数据集暂时跑出了一个比原效果好的结果，但是还没跑完

论文

SCRATCHING VISUAL TRANSFORMER’S BACK

WITH UNIFORM ATTENTION

1、模型图

在这里插入图片描述

2、思想

该论文主要研究Vision Transformer，ViT的效果好主要是多头自注意力的原因，本文发现ViT中的注意力大部分具有高熵值，即MSA偏向于学习密集的相互作用（极端情况就是均匀注意力），尽管密集自注意力的梯度更陡峭，更难学习（均匀注意力可以被单个梯度打破）。文章引入显式广播上下文(CB)和维度缩放CB(CBS)，将每一层的token进行平均池化后再提供给token，即由CB模块提供均匀注意力：
在这里插入图片描述
效果最好的是在MLP的末端。

3、效果

图像分类的效果
在这里插入图片描述
语义分割的效果

关注

2
点赞
踩
0

收藏

觉得还不错? 一键收藏
3
评论
第六十一周周报

第六十一周周报
复制链接

扫一扫

博客等级

码龄6年

153
原创

112
点赞

121
收藏

118
粉丝

关注

私信

热门文章

分类专栏

周报 48篇
前端
Vue 9篇
数据结构与算法
Spring全家桶
Spring 10篇
MyBatis 16篇
SpringMVC 15篇
SpringBoot 1篇
Github
Git 1篇
J2EE
Servlet 6篇
MVC 2篇
JSP
笔记 1篇
力扣 22篇
链表 6篇
数组 16篇
树 5篇

最新评论

第六十一周周报
啸空: 多谢回复，我的也没有
第六十一周周报
啸空: 你好，CB模块添加后效果提升了没
第十八周周报
qq_43235343: 请问一下有代码吗
第三十一周周报
weixin_49385843: 博主你好，请问可以讲解一下算法一和算法二吗
第十一周周报
Bryce ·Loski: 太牛了，一周能学这么多

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论 3

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。