热点项目｜近期Github热门项目Top5

最新推荐文章于 2024-09-10 09:44:12 发布

woshicver

最新推荐文章于 2024-09-10 09:44:12 发布

阅读量257

点赞数

作者 | Walker

转载自 | 磐创AI

【导读】:本文为大家总结了二月份最热门的机器学习项目top5。想要获取更多的机器学习、深度学习资源，欢迎大家点击上方蓝字关注我们的公众号:深度学习与计算机视觉。

No1: StyleGAN — OfficialTensorFlow Implementation

github地址：https://github.com/NVlabs/stylegan

上面的图片看起来像一幅典型的拼贴画，但事实上，这个收藏里的人都不是真的，这些人都是不存在的。所有这些人都是由称为Stylegan的算法生成的。

自从几年前发明了GAN算法，它的性能一直在稳步提升，但Stylegan的出将比赛提升了好几个level。开发人员提出了两种新的、自动化的方法来量化这些图像的质量，并公开了大量高质量的人脸数据集。

该github库同时也包含算法的官方TensorFlow实现。以下是了解有关Stylegan的一些关键资源：

Link	Description
http://stylegan.xyz/paper	Paper PDF.
http://stylegan.xyz/video	Result video.
http://stylegan.xyz/code	Source code.
http://stylegan.xyz/ffhq	Flickr-Faces-HQ dataset.
http://stylegan.xyz/drive	Google Drive folder.

No2：OpenAI’s Ground-Breaking Language Model – GPT-2

github地址：https://github.com/openai/gpt-2

下面来介绍一种来自于OpenAI的突破性语言模型GPT-2。2019年2月，GPT-2获得了非官方的“最受欢迎的”自然语言处理图书馆奖。但他们启动GPT-2的方式引起了不少关注，该团队声称该模型工作得很好，但由于害怕恶意使用。他们不能完全开放源代码。然而，他们还是在Github中发布了一个模型的较小版本，访问上述链接即可看到。

GPT-2是一个具有15亿参数的大型语言模型。该模型已经在800万个网页的数据集上进行了训练，当给定文本中的前一个单词时，模型的目标是预测下一个单词。

此外，我们还可以通过一些其它资源了解GPT-2：

Blog Post（https://blog.openai.com/better-language-models/）
Official Paper

（https://d4mucfpksywv.cloudfront.net/better-language-models/language-models.pdf）

No3：SC-FEGAN

Github地址：https://github.com/JoYoungjoo/SC-FEGAN

另一个GAN？！没错–Gans正在以狂风暴雨之势席卷数据科学世界。SC-FEGAN在风格上和我们上面讨论的Stylegan算法一样有趣。

上图完美地说明了SC-FEGAN的作用。SC-FEGAN用深度网络编辑面部图像，SC-FEGAN非常适合使用带有草图和颜色的直观输入，进而生成高质量的合成图像。我们使用SN-patchGAN鉴别器和Unet-like 产生器和选通卷积层，当然你可以使用开发人员训练过的深层神经网络编辑各种面部图像。

此外该存储库中还包含了帮助您在自己的计算机上构建SC-FEGAN模型的步骤。还等什么？赶紧来试一下吧！

No4：LazyNLP for Creating Massive TextDatasets

github地址：https://github.com/chiphuyen/lazynlp

LazyNLP背后的原理其实很简单——它能够对网站进行爬取、清理和消除重复数据，从而创建大量的单语数据集。Lazynlp将允许您创建比OpenAI用于培训GPT-2模型的数据集更大的数据集。使用这个库，您应该能够创建比OpenAI用于GPT-2的数据集大的数据集。

这个Github存储库还列出了创建自己的自定义NLP数据集需要遵循的5个步骤。如果您对这个项目感兴趣，点击上方链接具体查看详细信息。

No5：Subsync

github地址：https://github.com/smacke/subsync

该项目的实施始于2019年的哈克伊利诺斯州，获得了荣誉奖（排名前5名），Subsync是关于“语言无关自动同步字幕到视频，使字幕在视频中对齐到正确的起点”。该算法是利用python中的傅立叶变换技术建立的。

此外，Subsync也可以在VLC媒体播放器中工作！该模型大约需要20-30秒的训练时间（具体训练时间要取决于视频长度）。

最后我们给大家介绍一个数据集，Flickr-Faces-HQ Dataset (FFHQ)。（Github地址：https://github.com/NVlabs/ffhq-dataset）。

该数据非常适合学习和使用GAN进行试验，适用于当我们想要搜索高质量图像数据的场景。该数据集由70000张超高质量图像（1024 x 1024）组成，包含的人脸的维度有：如年龄、种族、形象背景等。

欢迎扫码关注：

觉得赞你就点在看，多谢大佬

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。