GitHub发布年度机器学习榜:TensorFlow最火,PyTorch失踪,Julia第四

最近,GitHub官方公布了2018年度机器学习排行榜,公布了最受欢迎的十大语言、十大软件包和十大项目。

排行榜是GitHub官方把2018年1月1日-2018年12月31日的数据扒了一下,通过计算上传代码、issue和PR的数量及评论数、PR review的数量排序计算出来的。

热门的语言Python、热门的框架TensorFlow都毫无疑问站在了第一名,不过令人诧异的是,PyTorch居然落榜了。

官方确定不是在搞笑?

语言:还是要学Python

通过查看带“机器学习”标签的项目贡献者的存储库,官方给存储库里最常见的语言进行了排名。

第一名毫无疑问是Python,Python在GitHub全站也非常热门,排名第三,仅次于JavaScript和Java。

其他的机器学习常用语言则有C++、JavaScript、Java、C#、Shell和TypeScript,对比下面这张全站语言排行榜,会发现它们在GitHub全站也是前十名的佼佼者。

另外,Julia、R和Scala虽然在全站榜上无名,不过在机器学习榜倒是进了前10,Julia和R都是数据科学家常用的语言,Scala在Apache Spark等大数据系统交互时十分常用。

天下四分,Numpy有其三

软件包榜单是GitHub官方从依赖图中计算机器学习或数据科学项目的Python包百分比数据。

其中,第一名的Numpy是一个支持多维数据数学运算的软件包,将近四分之三的机器学习和数据科学项目都用到了它;

Scipy,一个用于科学计算的软件包;

Pandas,用来管理数据集的软件包;

Matplotlib,一个可视化的库,超过40%的机器学习和数据科学项目都在使用;

Scikit-learn也是一个非常流行的机器学习软件包,包含大量机器学习算法的实现,近40%的项目在用它;

TensorFlow的使用率倒没那么高,大约只有不到1/4的包在用。

前十名里,剩下的都是实用软件包,Six是Python 2 和Python 3的兼容性库,Python-dateutilpytz是用于处理日期的包。

PyTorch失踪了

而在机器学习项目排行榜上,TensorFlow当之无愧排第一,贡献者的数量是第二名Scikit-learn的两倍。

第三名spaCy和第九名rasa_nlu是两个NLP项目。

第四名Julia,作为2018年横空出世的新语言在项目榜上排第四。

第五名openpose、第七名darkflow、第八名face_recognition和第十名tesseract,主要是图像处理领域。

可是,广受喜爱的PyTorch却在这个榜单上失踪了,原来——

PyTorch压根没给自己打上机器学习的标签。

不知道现在哭还来不来得及……

机器学习,秀翻GitHub

即使在GitHub全站,机器学习相关项目也十分火热。去年10月的GitHub 2018年度榜单发布后,官方就注意到了机器学习相关项目的超高存在感:

· TensorFlow是贡献最多的项目之一;

· PyTorch是增长最快的项目之一;

· Python是第三热门的语言;

也难怪要专门把机器学习拎出来列个排行榜了。

来源:量子位

延伸阅读:小编为您推荐以上热点的学习书单,供您参考:

1


长按二维码购买

《Apache Spark机器学习

书号:978-7-111-56255-9 

定价:59.00元

出版时间:2017/03/27

内容简介:

全书共11章,第1章从机器学习的角度介绍Apache Spark。第2章介绍如何使用Aparche Spark上的工具(如Spark SQL)进行机器学习数据准备,包括数据清洗、一致性识别、数据合并以及特征开发。第3~11章围绕Spark机器学习先后介绍了9个实际案例,内容涵盖整体视图、欺诈检测、风险评分、流失预测、产品推荐、教育分析、城市分析和开放数据建模等方面,囊括了大数据分析挖掘的主要应用场景。在每个案例中,作者对所使用的机器学习算法、数据与特征准备、模型评价方法、结果的解释都进行了详细的阐述,并给出了Scala、R语言、SPSS等环境下的关键代码.

2

长按二维码购买

Python 3标准库

书号:978-7-111-60895-0 

定价:199.00元

出版日期:2018/10/10

内容简介:

对程序员而言,标准库与语言本身同样重要,它好比一个百宝箱,能为各种常见的任务提供完美的解决方案,所以本书是所有Python程序员都必备的工具书!全书以案例驱动的方式讲解了标准库中数百个模块的使用方法(如何工作)和工作原理(为什么要这样工作),比标准库的官方文档更容易理解(一个简单的示例比一份手册文档更有帮助),为Python程序员熟练掌握和使用这些模块提供了绝佳指导。

3

长按二维码购买

Python学习手册

书号:978-7-111-60366-5 

定价:219.00元

出版日期:2018/10/30  

内容简介:

学习Python的主要内置对象类型,如数字、列表和字典。

使用Python语句创建和处理对象,并学习Python的通用语法模型。

使用函数减少代码冗余,使用包代码结构实现代码重用

学习Python模块:封装语句、函数以及其他工具,以便构建较大的组件

学习类,即Python用于组织代码的面向对象编程工具

使用Python的异常处理模型和开发工具编写大型程序

学习高级Python工具,包括装饰器、描述符、元类和Unicode处理等

4

长按二维码购买


TensorFlow机器学习实战指南

书号:978-7-111-57948-9 

定价:69.00元

出版日期:2017/09/25  

内容简介:

本书由资深数据科学家撰写,从实战角度系统讲解TensorFlow基本概念及各种应用实践。真实的应用场景和数据,丰富的代码实例,详尽的操作步骤,带你由浅入深系统掌握TensorFlow机器学习算法及其实现。

5

长按二维码购买

机器学习实战》

书号:978-7-111-60302-3 

定价:119.00元

出版日期:2018/08/30  

通过具体的例子、非常少的理论和两个产品级的Python框架——Scikit-learn 和 TensorFlow 。作者帮助你很直观地理解并掌握构建智能系统的概念和工具。你将学习一系列技术,从简单的线性回归开始到深度神经网络等。每章都有习题来帮助你应用学到的知识,你所需要的只是一点编程经验,仅此而已。

传播计算机知识、互动分享,华章与您共同进步!

长按二维码关注

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值