2019年度顶级开源机器学习项目

在这篇文章中,我们将着眼于一些在2019年由MyBridge排名的顶级开源机器学习项目。

1、Real-Time-Voice-Cloning (13.7 k⭐️)

这个项目是SV2TTS论文的一个实现,带有一个实时工作的声码器。使用这个r你可以在5秒内克隆一个语音,从而实时生成任意语音。SV2TTS三阶段深度学习框架允许从几秒钟的音频中创建语音的数字表示。

论文地址:

https://arxiv.org/abs/1806.04558

Github地址:

https://github.com/CorentinJ/Real-Time-Voice-Cloning

2、UGATIT(4.4K ⭐️)

这是一个U-GAT-IT的TensorFlow实现。本文在此基础上,提出了一种实现无监督图像-图像翻译的方法,该方法在端到端之间加入了一个新的注意模块和一个新的可学习归一化函数。

注意力模块引导模型关注更重要的区域,从而根据辅助分类器获得的注意力图区分源域和目标域。AdaLIN (Adaptive Layer-Instance Normalization)函数帮助模型通过学习参数控制形状和纹理的变化量。

论文地址:

https://arxiv.org/abs/1907.10830

Github地址:

https://github.com/taki0112/UGATIT

3、RAdam(1.9K ⭐️)

这是通过调整自适应学习过程的方差来实现的。作者使用图像分类、语言建模和神经机器翻译任务来获得实验结果。

论文地址:

https://arxiv.org/abs/1908.03265

Github地址:

https://github.com/LiyuanLucasLiu/RAdam
 

4、Dlrm(1.7K ⭐️)

这是最新的深度学习推荐模型(DLRM),可在PyTorch和Caffe2中可用。该模型有一个专门的并行化方案,利用嵌入表上的模型并行性来迁移内存约束。这使得利用数据并行性来扩展全连接层的计算成为可能。

论文地址:

https://arxiv.org/abs/1906.00091

Github地址:

https://github.com/facebookresearch/dlrm

5、TecoGAN(1.3K ⭐️)

本文提出了一种对抗性训练视频的超分辨率,在不牺牲空间细节的前提下获得时间相干的解。它还提出了一个乒乓损失,可以在不降低感知质量的情况下消除周期性网络中的时间伪影。

论文地址:

https://github.com/thunil/TecoGAN

Github地址:

https://arxiv.org/abs/1811.09393

6、Megatron-LM(1.1K ⭐️)

目前,它能够在512个GPU上使用8路模型和64路数据并行性来训练72层,83亿参数的GPT2语言模型。它还可以在3天内在64个V100 GPU上训练BERT Large。

Github地址:

https://github.com/NVIDIA/Megatron-LM

7、TensorNetwork(1.0K ⭐️)

TensorNetwork是一个用于实现tensor网络算法的开源库。它是tensor网络包装器,用于TensorFlow、JAX、PyTorch和NumPy。tensor网络是目前应用于机器学习研究的稀疏数据结构。开发人员还不提倡在生产环境中使用该工具。

论文地址:

https://arxiv.org/abs/1906.06329

Github地址:

https://github.com/google/tensornetwork

8、Python_autocomplete(708 ⭐️)

这个项目的目的是测试LSTM能在多大程度上自动完成Python代码。它基于TensorFlow。

Github地址:

https://github.com/vpj/python_autocomplete

9、Buffalo(365 ⭐️)

Buffalo是一个用于推荐系统的快速、可扩展、可生产的开源项目。它有效地利用系统资源,从而在低规格的机器上实现高性能。

Github地址:

https://github.com/kakao/buffalo

10、Realistic-Neural-Talking-Head-Models(312 ⭐️)

本文提出了一个可创建个性化真实感谈话头部模型的模型。它的目的是在给定面部表情的情况下合成逼真的个性化头部图像。这适用于视频会议,特殊效果行业以及多人游戏。所提出的系统能够以特定于人的方式初始化生成器和鉴别器的参数。这使训练过程可以快速消耗一些图像。

Github地址:

https://github.com/vincent-thevenin/Realistic-Neural-Talking-Head-Models

公众号[三次方AIRX]:三次方•数字化人才在线教育平台。帮助Z时代大学生和0-5年职场人获得混合现实、人工智能、游戏开发、大数据等能力。

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值