我们对比了GitHub上8800个开源机器学习项目,并选出了其中的Top30

原创 2018年01月30日 15:10:19

大数据文摘作品

编译:叶一、Shan LIU、Aileen


2017年是机器学习应用全面开花的一年,惊为天人的想法和项目层出不穷。我们对比了过去一年中近8800个开源机器学习项目,并挑选了其中较好的30个(Top 0.3%)列举于此。


这是一份极具竞争性的列表,它精挑细选了发表于2017年1月-12月份的机器学习库、数据集和应用类的优质项目。我们通过流行度、参与度和时近性来对其质量进行评级。有一项数据可以让你对表单质量有一个直观印象:这些项目的GitHub平均stars数是3558。


开源项目对于数据科学家而言是很有意义的。你可以通过阅读源代码,在前人的基础上构建更加强大的项目。你可以尽情尝试一下这些可能在去年与你失之交臂的机器学习项目。


No.1 - FastText:快速文本表示/分类库

GitHub stars数: 11786个

来源:Facebook研究

链接:

https://github.com/facebookresearch/fastText


以及[Muse:基于FastText的多语言无监督/监督词嵌入(GitHub stars数:695个)https://github.com/facebookresearch/MUSE]


No.2- Deep-photo-styletransfer:康奈尔大学 Fujun Luan 论文《Deep Photo Style Transfer》的代码与数据

GitHub stars数:9747个

链接:

https://github.com/luanfujun/deep-photo-styletransfer



No.3 - face recognition:世界上最简单的适用于Pyhthon的面部识别api以及命令行 

GitHub stars数:8672个

来源:Adam Geitgey

链接:

https://github.com/ageitgey/face_recognition



No.4 - Magenta:机器智能音乐与艺术生成器

GitHub stars数:8113

链接:

https://github.com/tensorflow/magenta



No.5 - Sonnet:基于 TensorFlow 的神经网络库

GitHub stars数:5731个

来源:DeepMind 成员 Malcolm Reynolds
链接:

https://github.com/deepmind/sonnet



No.6 - deeplearn.js:网页端硬件加速机器学习库
GitHub stars数:5462个
来源:Google Brain 团队 Nikhil Thorat

链接:

https://github.com/PAIR-code/deeplearnjs



No.7 - Fast Style Transfer:TensorFlow 快速风格转换

GitHub stars数:4843个

来源:MIT的Logan Engstrom 

链接:

https://github.com/lengstrom/fast-style-transfer



No.8 - Pysc2:星际争霸II 学习环境

GitHub stars数:3683个

来源:DeepMind Timo Ewalds 等人
链接:

https://github.com/deepmind/pysc2



No.9 - AirSim:微软AI和研究院出品的基于虚幻引擎的开源自动驾驶模拟器

GitHub stars数:3681个
来源:微软的Shital Shah

链接:

https://github.com/Microsoft/AirSim



No.10 - Facets:机器学习数据集可视化工具

GitHub stars数:3371个

来源:Google Brain

链接:

https://github.com/PAIR-code/facets



No.11 - Style2Paints:AI漫画线稿上色工具

GitHub stars数: 3310个

链接:

https://github.com/lllyasviel/style2paints



No.12 - Tensor2Tensor:用于广义序列-序列模型的工具库

GitHub stars数目: 3087个

来源:Google Brain 的Ryan Sepassi

链接:

https://github.com/tensorflow/tensor2tensor



No.13- 基于 PyTorch 的图像对图像转换工具 (如horse2zebra, edges2cats,等)

GitHub stars数:2847个

来源:UC Berkeley 朱俊彦博士

链接:

https://github.com/junyanz/pytorch-CycleGAN-and-pix2pix




No.14 - Faiss:用密集向量高效相似性检索与聚类的工具库

GitHub stars数:2629个

来源:Facebook

链接:

https://github.com/facebookresearch/faiss



No.15 Fashion-mnist:一个类似于 MNIST 的时尚产品数据集

GitHub stars数:2780个

来源:Zalando Tech 的 Han Xiao

链接:

https://github.com/zalandoresearch/fashion-mnist



No.16 - ParlAI:适用于在各类公开的对话数据集上训练与评估AI模型的一个框架

GitHub stars数: 2578个

来源:Facebook Research的 Alexander Miller
链接:

https://github.com/facebookresearch/ParlAI




No.17 Fairseq:序列到序列工具包

GitHub stars数: 2571个

来源:FAIR

链接:

https://github.com/facebookresearch/fairseq



No.18 Pyro:使用 Python 和 PyTorch 进行深度通用概率编程

GitHub stars数: 2387个

来源:Uber AI Labs

链接: 

https://github.com/uber/pyro




No.19 iGAN:基于 GAN 的交互图像生成器

GitHub stars数: 2369个

链接:

https://github.com/junyanz/iGAN



No.20 Deep-image-prior:使用神经网络进行图像恢复,然而无需学习过程

GitHub stars数: 2188个

来源:Skoltech 的 Dmitry Ulyanov博士
链接:

https://github.com/DmitryUlyanov/deep-image-prior




No.21 Face_classification:基于 Keras CNN 模型与 OpenCV 的实时面部检测和表情/性别分类,训练与 fer2013/imdb 数据集

GitHub stars数: 1967个

链接:

https://github.com/oarriaga/face_classification



No.22 Speech to Text WaveNet:使用 DeepMind 的 WaveNet 和 TensorFlow 构成的端到端句级英语语音识别

GitHub stars数: 1961个

来源: Kakao Brain 的 Namju Kim

链接:

https://github.com/buriburisuri/speech-to-text-wavenet




No.23 StarGAN:用于多领域图像-图像转换的统一生成对抗网络

GitHub stars数: 1954个

来源:韩国大学的Yunjey Choi

链接:

https://github.com/yunjey/StarGAN





No.24 MI-agents:Unity 机器学习智能体

GitHub stars数: 1658个

来源:深度学习 Unity3D 的Arthur Juliani

链接:

https://github.com/Unity-Technologies/ml-agents




No.25 Deep Video Analytics:分布式可视化搜索和可视化数据分析平台

GitHub stars数: 1494个

来源:康奈尔大学的Akshay Bhat



No.26  OpenNMT:Torch 上的开源神经机器翻译

GitHub stars数:1490个
链接:

https://github.com/OpenNMT/OpenNMT



No.27 Pix2PixHD:使用条件 GAN 合成和处理 2048×1024 分辨率的图像

GitHub stars数:1283个

来源:英伟达 AI 科学家 Ming-Yu Liu

链接:

https://github.com/NVIDIA/pix2pixHD



No.28 Horovod:分布式 TensorFlow 训练框架

GitHub stars数:1188 个

来源:Uber 工程团队

链接:

https://github.com/uber/horovod



No.29 AI-Blocks:强大而直观的 WYSIWYG 界面,可让任何人创建机器学习模型

GitHub stars数:899 个

链接:

https://github.com/MrNothing/AI-Blocks



No.30 Voice Conversion with Non-Parallel Data:基于 TensorFlow 的深度神经网络语音转换(语音风格转换)

GitHub stars数:845个

来源:Kakao Brain人工智能研究团队的Dabi Ahn

链接:

https://github.com/andabi/deep-voice-conversion


原文链接:

https://medium.mybridge.co/30-amazing-machine-learning-projects-for-the-past-year-v-2018-b853b8621ac7

版权声明:本文为博主原创文章,未经博主允许不得转载。

2017 年 GitHub 中最为流行的 30 个开源机器学习项目

2017 年里哪些机器学习项目最受人关注?Mybridge 为我们整理了一份 Top 30 列表,以下所有项目均附有 GitHub 链接。 我...
  • Uwr44UOuQcNsUQb60zk2
  • Uwr44UOuQcNsUQb60zk2
  • 2018年01月07日 06:51
  • 1028

我们对比了GitHub上8800个开源机器学习项目,并选出了其中的Top30

2017年是机器学习应用全面开花的一年,惊为天人的想法和项目层出不穷。我们对比了过去一年中近8800个开源机器学习项目,并挑选了其中较好的30个(Top 0.3%)列举于此。 ...
  • duke370503
  • duke370503
  • 2018年01月31日 14:24
  • 54

我们对比了GitHub上8800个开源机器学习项目,并选出了其中的Top30

大数据文摘作品编译:叶一、Shan LIU、Aileen2017年是机器学习应用全面开花的一年,惊为天人的想法和项目层出不穷。我们对比了过去一年中近8800个开源机器学习项目,并挑选了其中较好的30个...
  • BigDataDigest
  • BigDataDigest
  • 2018年01月30日 15:10
  • 532

从8800个机器学习开源项目中精选出Top30,推荐给你

A. 神经网络:深度学习 A-ZTM : 亲手搭建人工神经网络(推荐次数68,745 , 4.5/5 stars) 链接:bit.ly/2CH1WcQ B.用Python进行深度学...
  • u012017783
  • u012017783
  • 2018年01月10日 21:11
  • 879

资源 | 2017年GitHub中Top 30开源机器学习项目

开源机器学习项目是开放资源的一种重要类型,为用户和学习者提供了极大的便利。近期,Mybridge在对比了过去一年中机器学习领域约8800个开源项目后,评选出30个2017年度优秀的开源项目,包含机器学...
  • m0epNwstYk4
  • m0epNwstYk4
  • 2018年01月10日 00:00
  • 756

看看开源对我们的影响,有多少是我们经常用的

http://sourceforge.net/awards/cca/Best Overall - FinalistsAzureus BitTorrent ClientphpMyAdmin7-ZipeM...
  • wonder4
  • wonder4
  • 2006年03月31日 12:38
  • 1759

只用200行Go代码写一个自己的区块链!

“用不到200行 Go 代码就能实现一个自己的区块链!” 听起来有意思吗?有什么能比开发一个自己的区块链更好的学习实践方法呢?那我们就一起来实践下! 因为我们是一家从事医疗健康领...
  • duke370503
  • duke370503
  • 2018年01月30日 15:29
  • 318

Github近期最有趣的10款机器学习开源项目

来源:PaperWeekly本文共900字,建议阅读6分钟。本文为你罗列近期Github上十大有趣的机器学习开源项目。-01-Face Recognition#世界上最简单的人脸识别库本项目号称世界上...
  • tMb8Z9Vdm66wH68VX1
  • tMb8Z9Vdm66wH68VX1
  • 2018年01月02日 00:00
  • 699

28款GitHub最流行的开源机器学习项目

28款GitHub最流行的开源机器学习项目(一):TensorFlow排榜首  readygo 浏览 673 2016-04-18 20:31:12 机器学习开源githubT...
  • zkl99999
  • zkl99999
  • 2016年04月19日 18:56
  • 10297

“开源”创造者为你论述这一术语的前世今生

大数据文摘作品 编译:修竹、元元、蒋宝尚 “开源”一词被广泛应用于软件领域,这一术语对时代的进步做出了贡献。值此术语诞生20周年之际,其创造者Christine Peterson对其的前世今生...
  • BigDataDigest
  • BigDataDigest
  • 2018年02月18日 21:04
  • 54
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:我们对比了GitHub上8800个开源机器学习项目,并选出了其中的Top30
举报原因:
原因补充:

(最多只允许输入30个字)