SwinTransformer模型转化：pytorch模型转keras。，工作感悟

最新推荐文章于 2024-09-03 21:51:28 发布

Java有多久学会

最新推荐文章于 2024-09-03 21:51:28 发布

阅读量871

点赞数 14

分类专栏： 2024年程序员学习文章标签： pytorch keras 人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_60635609/article/details/136928526

版权

本文介绍了如何将基于PyTorch实现的SwinTransformer模型转换为Keras版本，详细展示了从qkv计算、注意力矩阵到FFN的各个步骤，并探讨了转换过程中的关键细节和技术挑战。

摘要由CSDN通过智能技术生成

coords_h = np.arange(self.window_size[0])

coords_w = np.arange(self.window_size[1])

coords = np.stack(np.meshgrid(coords_h, coords_w, indexing=“ij”)) # [2, Mh, Mw]

coords_flatten = np.reshape(coords, [2, -1]) # [2, Mh*Mw]

[2, MhMw, 1] - [2, 1, MhMw]

relative_coords = coords_flatten[:, :, None] - coords_flatten[:, None, :] # [2, MhMw, MhMw]

relative_coords = np.transpose(relative_coords, [1, 2, 0]) # [MhMw, MhMw, 2]

relative_coords[:, :, 0] += self.window_size[0] - 1 # shift to start from 0

relative_coords[:, :, 1] += self.window_size[1] - 1

relative_coords[:, :, 0] *= 2 * self.window_size[1] - 1

relative_position_index = relative_coords.sum(-1) # [MhMw, MhMw]

self.relative_position_index = tf.Variable(tf.convert_to_tensor(relative_position_index),

trainable=False,

dtype=tf.int32,

name=“relative_position_index”)

def call(self, x, mask=None, training=None):

“”"

Args:

x: input features with shape of (num_windowsB, MhMw, C)

mask: (0/-inf) mask with shape of (num_windows, WhWw, WhWw) or None

training: whether training mode

“”"

[batch_sizenum_windows, MhMw, total_embed_dim]

B_, N, C = x.shape

qkv(): -> [batch_sizenum_windows, MhMw, 3 * total_embed_dim]

qkv = self.qkv(x)

reshape: -> [batch_sizenum_windows, MhMw, 3, num_heads, embed_dim_per_head]

qkv = tf.reshape(qkv, [B_, N, 3, self.num_heads, C // self.num_heads])

transpose: -> [3, batch_sizenum_windows, num_heads, MhMw, embed_dim_per_head]

qkv = tf.transpose(qkv, [2, 0, 3, 1, 4])

[batch_sizenum_windows, num_heads, MhMw, embed_dim_per_head]

q, k, v = qkv[0], qkv[1], qkv[2]

transpose: -> [batch_sizenum_windows, num_heads, embed_dim_per_head, MhMw]

multiply -> [batch_sizenum_windows, num_heads, MhMw, Mh*Mw]

attn = tf.matmul(a=q, b=k, transpose_b=True) * self.scale

relative_position_bias(reshape): [MhMwMhMw,nH] -> [MhMw,Mh*Mw,nH]

relative_position_bias = tf.gather(self.relative_position_bias_table,

tf.reshape(self.relative_position_index, [-1]))

relative_position_bias = tf.reshape(relative_position_bias,

[self.window_size[0] * self.window_size[1],

self.window_size[0] * self.window_size[1],

-1])

relative_position_bias = tf.transpose(relative_position_bias, [2, 0, 1]) # [nH, MhMw, MhMw]

attn = attn + tf.expand_dims(relative_position_bias, 0)

if mask is not None:

mask: [nW, MhMw, MhMw]

nW = mask.shape[0] # num_windows

attn(reshape): [batch_size, num_windows, num_heads, MhMw, MhMw]

mask(expand_dim): [1, nW, 1, MhMw, MhMw]

attn = tf.reshape(attn, [B_ // nW, nW, self.num_heads, N, N]) + tf.expand_dims(tf.expand_dims(mask, 1), 0)

attn = tf.reshape(attn, [-1, self.num_heads,

最低0.47元/天解锁文章

Java有多久学会

关注

14
点赞
踩
30

收藏

觉得还不错? 一键收藏
0
评论
SwinTransformer模型转化：pytorch模型转keras。，工作感悟

现在能在网上找到很多很多的学习资源，有免费的也有收费的，当我拿到1套比较全的学习资源之前，我并没着急去看第1节，我而是去审视这套资源是否值得学习，有时候也会去问一些学长的意见，如果可以之后，我会对这套学习资源做1个学习计划，我的学习计划主要包括规划图和学习进度表。(img-jdWgibyq-1711069840494)]分享给大家这份我薅到的免费视频资料，质量还不错，大家可以跟着学习。分享给大家这份我薅到的免费视频资料，质量还不错，大家可以跟着学习。
复制链接

扫一扫

专栏目录

普通网友 CSDN认证博客专家 CSDN认证企业博客

码龄3年

620: 原创

-: 周排名

-: 总排名

43万+: 访问

: 等级

1万+: 积分

6281: 粉丝

9074: 获赞

10: 评论

9425: 收藏

私信

关注

热门文章

分类专栏

最新评论

android 五大应用开发框架，2024年最新面试复盘总结
成年猛虎: 微信添加频繁了
python模块—logging_no handler could be found for root python
北风之神c: 总结的很全面，写得赞，博主用心了。此国产日志 https://nb-log-doc.readthedocs.io/zh_CN/latest 使用原生 loggng封装，兼容性和替换性100%,大幅简化logging的使用。 1、日志能根据级别能够自动变彩色。 1 2、print自动变彩色。 3、日志和print在pycahrm控制台的输出都自动可以点击跳转到文件和行号。 4、多进程日志切割安全，文件日志写入性能高。 5、入参简单，能一键自动记录到多种地方。 6、兼容 loguru模式。相比 loguru 有10胜。 pip install nb_log 。
2024年Python最全程序员全职接单一个月的感触，Python面试题集锦在这里
普通网友: 好文，细节很到位！【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
2024 年最值得关注的 34 个 Python 开源项目——Let‘s go!_python botflow(1)
普通网友: 你的博客内容深入浅出，总是让我不再感到学习的困难，每一篇博文都是我学习的宝库。【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】

最新文章

2024

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。