第五周学习报告

学习目标:

  • 深度学习花书
  • 一篇论文

学习内容:

  • 花书第六章
  • StyleSwin: Transformer-based GAN for High-resolution Image Generation

学习时间:

10.3-10.7

学习产出:

StyleSwin

1、什么是StyleSwin?
在这里插入图片描述
2、StyleSwin结构
在这里插入图片描述
方法:
在这里插入图片描述
(1)样式注入方法对比:
在这里插入图片描述
(2)双重注意力使用方法
在这里插入图片描述
如图所示,将h个注意头分成两组:磁头的前半部分执行常规的窗口注意,而后半部分计算移动的窗口注意,这两个结果进一步连接以形成输出。
计算方法:
在这里插入图片描述
WO ∈ RC×C用于混合磁头以输出投影矩阵,head的计算公式为:
在这里插入图片描述
WiQ、WiK、WiV∈ RC×(C/h) 分别为第i个头部的查询、键和值投影矩阵。使用双重注意力后,原来64x64分辨率需要8个transformer块,现在只需要4个。

(3)局部-全局位置编码
在这里插入图片描述
采样之后,使用如下编码添加特征图
在这里插入图片描述
ωk=1/100002k,(i,j)表示二维位置。在每个transformer块中使用SPE提供本地上下文的相对位置,在每个尺度上引入PRE提供全局位置。

3、深度学习花书
学习了深度前馈网络,包括梯度、隐藏单元、架构设计和反向传播。
4、了解了ICCV和CVPR近三年图像生成方面的论文。

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值