今日AI :字节开源了个锤子:帮你高效训练 PyTorch 模型;VFormer:开源的视觉 Transformer 组件...

喜欢就关注 AIZOO 吧!

今日 AI 资讯主要有:字节跳动在 Github 开源了一个锤子,帮我们高效率训练深度学习模型;VFormer开源,一个基于 PyTorch 的 视觉 Transfomer 模块化的开源库。

64a0274b660d41721a97ef964a821858.png

字节跳动开源锤子(Hammer)

链接地址:

https://github.com/bytedance/Hammer

这个名字不是我恶搞,它的确就叫锤子(Hammer)。官方的介绍是:

f07364a689eded8e038e9d00e9e78dfd.png

翻译一下:一个高效的训练深度学习模型的库。本仓库提供了基于 PyTorch 的高效训练库。

因为此仓库刚刚开源一天多,star 还不多,而且提供的模型也不太多,主要是 styleGAN、styleGAN2、styleGAN3。当然,看官方的介绍,里面会提供越来越多的各种模型,而不是仅限于 GAN。

f0cb59028451f284153c80324ade648e.gif

StyleGAN3 效果

这个仓库,很明显起得名字很大气,而且介绍也很大气,说不准未来会真的做成一个高效训练的库。

我们关注这种代码有什么意义呢?主要是深度学习发展日新月异,通过看大公司开源的代码,我们可以很好的学习一些新特性,以及代码的组织结构。

让我们静观其变吧。


dbab059436e33cf9e81e6a1cdb468ce1.png

VFormer:基于 PyTorch 的模块化的视觉 Transmer 库

c13ba67b7ae5203ba323c5524e6b6e6c.png

库特性:

提供知名的 ViT 的实现,我们将他们分解为模块化组件(如编码器、注意力机制和解码器)。通过组合不同架构的组件,可以轻松开发自定义模型。

目前已经实现的知名算法:

32877b2a5cd8cf8f5e49cf3faa15ead6.png

用法:

例如想使用 WindowAttention

from vformer.attention import WindowAttention

window_attn = WindowAttention(
        dim=128,
        window_size=7,
        num_heads=2,
        **kwargs,
    )

SwinEncoder:

from vformer.encoder import SwinEncoder

swin_encoder = SwinEncoder(
        dim=128,
        input_resolution=(224, 224),
        depth=2,
        num_heads=2,
        window_size=7,
        **kwargs,
    )

以及整体算法实现:

from vformer.encoder import SwinEncoder

swin_encoder = SwinEncoder(
        dim=128,
        input_resolution=(224, 224),
        depth=2,
        num_heads=2,
        window_size=7,
        **kwargs,
    )

好啦,今天的 AI 早报就介绍这两个最新开源的库吧。早安~

157797b3a98872b780183c268970aa2d.png

欢迎扫描下方的二维码添加小助手微信,邀请您加入我们的微信交流群。

群里有多位清北复交、BAT、AI独角兽大牛和众多深度学习er在一起愉快的交流技术,有任何问题,都可以咨询大家,欢迎你的加入哦。

6fcd0c5e9a69b61cc0de26a5065c89d5.png

 添加小助手微信,邀您进 AIZOO 技术交流群

听说点个在看的人运气都很好~

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值