第五周学习报告

最新推荐文章于 2024-04-18 10:06:49 发布

童、一

最新推荐文章于 2024-04-18 10:06:49 发布

阅读量1k

点赞数

文章标签：学习深度学习机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_44432831/article/details/127193133

版权

学习目标：

深度学习花书
一篇论文

学习内容：

花书第六章
StyleSwin: Transformer-based GAN for High-resolution Image Generation

学习时间：

10.3-10.7

学习产出：

StyleSwin

1、什么是StyleSwin？
在这里插入图片描述
2、StyleSwin结构

方法：

（1）样式注入方法对比：

（2）双重注意力使用方法

如图所示，将h个注意头分成两组：磁头的前半部分执行常规的窗口注意，而后半部分计算移动的窗口注意，这两个结果进一步连接以形成输出。
计算方法：
在这里插入图片描述
W^O∈ R^C×C用于混合磁头以输出投影矩阵，head的计算公式为：

W_i^Q、W_i^K、W_i^V∈ R^C×(C/h) 分别为第i个头部的查询、键和值投影矩阵。使用双重注意力后，原来64x64分辨率需要8个transformer块，现在只需要4个。

（3）局部-全局位置编码
在这里插入图片描述
采样之后，使用如下编码添加特征图

ω_k=1/10000^2k，(i,j)表示二维位置。在每个transformer块中使用SPE提供本地上下文的相对位置，在每个尺度上引入PRE提供全局位置。

3、深度学习花书
学习了深度前馈网络，包括梯度、隐藏单元、架构设计和反向传播。
4、了解了ICCV和CVPR近三年图像生成方面的论文。

关注

0
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
第五周学习报告

第五周周报
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。