DeepMind宣布采用谷歌开源的深度学习框架TensorFlow,不再采用Torch框架。Torch 诞生时间较久,直到去年Facebook 开源了大量Torch的深度学习模块才开始流行起来。
DeepMind是谷歌并购的一家AI公司,今年因AlphaGo以4:1的成绩战胜了韩国围棋大师李世石而名声大噪。除此以外,谷歌还有规模更大的Google Brain团队。
对于希望在应用中整合深度学习功能的开发者来说,GitHub 上其实还有很多不错的开源项目值得关注,首先我们推荐目前规模人气最高的 TOP3:
一、Caffe31。源自加州伯克利分校的Caffe,由C++开发。雅虎今年2月份开源的CaffeOnSpark, 就是基于 Caffe,还有能够优化迭代工作负载的数据运算系统 Spark (它是对 Hadoop 的补充,可以在 Hadoop 文件系统中并行运行)。雅虎所做的只是创建了一个可以在Spark集群上运行Caffee的方法。它可以单独在Spark上运行,或者在 Hadoop上。Feng说,除了让AI开发人员更方便的使用相似工具、避免来回移动数据外,CaffeOnSpark还将在众多服务器中分发深度学习进程变得相对容易,而这正是谷歌开源版本的TensorFlow做不到的。
二、Theano24。2008年诞生于蒙特利尔理工学院,Theano派生出了大量深度学习Python 软件包,最著名的包括Blocks和Keras。
三、Torch13。Torch 诞生已经有十年之久,但是真正起势得益于去年Facebook 开源了大量Torch的深度学习模块和扩展。Torch另外一个特殊之处是采用了不怎么流行的编程语言Lua(该语言曾被用来开发视频游戏)。
除了以上三个比较成熟知名的项目,还有很多有特色的深度学习开源框架也值得关注:
四、Brainstorm6。来自瑞士人工智能实验室IDSIA 的一个非常发展前景很不错的深度学习软件包,Brainstorm 能够处理上百层的超级深度神经网络——所谓的公路网络Highway Networks。
五、Chainer5。来自一个日本的深度学习创业公司Preferred Networks,今年6月发布的一个Python框架。Chainer 的设计基于 define by run原则,也就是说,该网络在运行中动态定义,而不是在启动时定义,这里有Chainer的详细文档。
六、Deeplearning4j17。 顾名思义,Deeplearning4j 是”for Java”的深度学习框架,也是首个商用级别的深度学习开源库。Deeplearning4j由创业公司Skymind于2014 年6月发布,使用Deeplearning4j的不乏埃森哲、雪弗兰、博斯咨询和IBM等明星企业。
DeepLearning4j 是一个面向生产环境和商业应用的高成熟度深度学习开源库,可与Hadoop和Spark集成,即插即用,方便开发者在APP中快速集成深度学习功能,可应用于以下深度学习领域:
人脸/图像识别
语音搜索
语音转文字(Speech to text)
垃圾信息过滤(异常侦测)
电商欺诈侦测
七、Marvin5。是普林斯顿大学视觉工作组新推出的C++ 框架。该团队还提供了一个文件用于将Caffe模型转化成语Marvin兼容的模式。
八、ConvNetJS8。这是斯坦福大学博士生Andrej Karpathy开发浏览器插件,基于万能的JavaScript可以在你的游览器中训练神经网络。Karpathy还写了一个ConvNetJS 的入门教程,以及一个简洁的浏览器演示项目。
九、MXNet12。出自CXXNet、Minerva、Purine 等项目的开发者之手,主要用C++ 编写。MXNet 强调提高内存使用的效率,甚至能在智能手机上运行诸如图像识别等任务。
十、Neon5。由创业公司Nervana Systems 于今年五月开源,在某些基准测试中,由Python和Sass 开发的Neon的测试成绩甚至要优于Caffeine、Torch 和谷歌的TensorFlow。