数据重排-einops库的Rearrange函数解释

Rearrange('b c (h p1) (w p2) -> b (h w) (p1 p2 c)', p1 = patch_height, p2 = patch_width)

上面的代码来自vit-pytorch的第96行,做的处理是将图片变成许多个patch。下面写一下对该函数的说明:

b c (h p1) (w p2) -> b (h w) (p1 p2 c) 是关键,我们假设原来的输入为:(B, C, H, W),则这里就可以写出

这样,我们的输出就可以通过上式计算出来,为

以ViT为例,假设batch size=1,就是将输入的(1, 3, 224, 224)的图片,patchsize=p1=p2=16,变成了(1, 196, 768),进行了patch操作。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值