GitHub发布年度机器学习榜:TensorFlow最火,PyTorch失踪,Julia第四

郭一璞 发自 凹非寺 
量子位 报道 | 公众号 QbitAI

最近,GitHub官方公布了2018年度机器学习排行榜,公布了最受欢迎的十大语言、十大软件包和十大项目。

排行榜是GitHub官方把2018年1月1日-2018年12月31日的数据扒了一下,通过计算上传代码、issue和PR的数量及评论数、PR review的数量排序计算出来的。

热门的语言Python、热门的框架TensorFlow都毫无疑问站在了第一名,不过令人诧异的是,PyTorch居然落榜了。

官方确定不是在搞笑?

语言:还是要学Python

640?wx_fmt=png

通过查看带“机器学习”标签的项目贡献者的存储库,官方给存储库里最常见的语言进行了排名。

第一名毫无疑问是Python,Python在GitHub全站也非常热门,排名第三,仅次于JavaScript和Java。

其他的机器学习常用语言则有C++、JavaScript、Java、C#、Shell和TypeScript,对比下面这张全站语言排行榜,会发现它们在GitHub全站也是前十名的佼佼者。

640?wx_fmt=jpeg

另外,Julia、R和Scala虽然在全站榜上无名,不过在机器学习榜倒是进了前10,Julia和R都是数据科学家常用的语言,Scala在Apache Spark等大数据系统交互时十分常用。

天下四分,Numpy有其三

640?wx_fmt=png

软件包榜单是GitHub官方从依赖图中计算机器学习或数据科学项目的Python包百分比数据。

其中,第一名的Numpy是一个支持多维数据数学运算的软件包,将近四分之三的机器学习和数据科学项目都用到了它;

Scipy,一个用于科学计算的软件包;

Pandas,用来管理数据集的软件包;

Matplotlib,一个可视化的库,超过40%的机器学习和数据科学项目都在使用;

Scikit-learn也是一个非常流行的机器学习软件包,包含大量机器学习算法的实现,近40%的项目在用它;

TensorFlow的使用率倒没那么高,大约只有不到1/4的包在用。

前十名里,剩下的都是实用软件包,Six是Python 2 和Python 3的兼容性库,Python-dateutilpytz是用于处理日期的包。

PyTorch失踪了

640?wx_fmt=png

而在机器学习项目排行榜上,TensorFlow当之无愧排第一,贡献者的数量是第二名Scikit-learn的两倍。

第三名spaCy和第九名rasa_nlu是两个NLP项目。

第四名Julia,作为2018年横空出世的新语言在项目榜上排第四。

第五名openpose、第七名darkflow、第八名face_recognition和第十名tesseract,主要是图像处理领域。

可是,广受喜爱的PyTorch却在这个榜单上失踪了,原来——

PyTorch压根没给自己打上机器学习的标签。

640?wx_fmt=png

不知道现在哭还来不来得及……

机器学习,秀翻GitHub

即使在GitHub全站,机器学习相关项目也十分火热。去年10月的GitHub 2018年度榜单发布后,官方就注意到了机器学习相关项目的超高存在感:

· TensorFlow是贡献最多的项目之一;

· PyTorch是增长最快的项目之一;

· Python是第三热门的语言;

也难怪要专门把机器学习拎出来列个排行榜了。

榜单地址:
https://github.blog/2019-01-24-the-state-of-the-octoverse-machine-learning/

作者系网易新闻·网易号“各有态度”签约作者


2018中国人工智能明星创业公司

640?wx_fmt=jpeg

加入社群

量子位AI社群开始招募啦,欢迎对AI感兴趣的同学,在量子位公众号(QbitAI)对话界面回复关键字“交流群”,获取入群方式;


此外,量子位专业细分群(自动驾驶、CV、NLP、机器学习等)正在招募,面向正在从事相关领域的工程师及研究人员。


进专业群请在量子位公众号(QbitAI)对话界面回复关键字“专业群”,获取入群方式。(专业群审核较严,敬请谅解)

诚挚招聘

量子位正在招募编辑/记者,工作地点在北京中关村。期待有才气、有热情的同学加入我们!相关细节,请在量子位公众号(QbitAI)对话界面,回复“招聘”两个字。

640?wx_fmt=jpeg

量子位 QbitAI · 头条号签约作者

վ'ᴗ' ի 追踪AI技术和产品新动态

喜欢就点「好看」吧 !

没有更多推荐了,返回首页