一些单机处理大数据开源工具

原创 2013年12月01日 22:28:11

1. LibFM

项目主页:http://www.libfm.org/


2. Svdfeature

项目主页:http://apex.sjtu.edu.cn/apex_wiki/svdfeature


3. Libsvm和Liblinear

libsvm项目主页:http://www.csie.ntu.edu.tw/~cjlin/libsvm/

liblinear项目主页:http://www.csie.ntu.edu.tw/~cjlin/liblinear/

初次使用必读:practical guide

libsvm的开发心得by林智仁:http://www.csie.ntu.edu.tw/~cjlin/talks/kdd.pdf


4. rt-rank

项目主页:http://research.engineering.wustl.edu/~amohan/

rt-rank中实现了推荐系统中常见的random forests和gradient boosted decision trees这两种方法,使用起来很方便。


3. Mahout

项目主页:http://mahout.apache.org/


4. MyMediaLite

项目主页:http://www.ismll.uni-hildesheim.de/mymedialite/


4. GraphLab 和 GraphChi

GraphLab项目主页:http://graphlab.org/ 

GraphChi项目主页:http://graphlab.org/graphchi/

GraphChi的下载地址:https://code.google.com/p/graphchi/downloads/detail?name=graphchi_src_v0.1.2_toolkits.tar.gz

GraphChi介绍:http://www.technologyreview.com/news/428497/your-laptop-can-now-analyze-big-data/?nlid=nldly&nld=2012-07-17

CF for GraphChi: http://bickson.blogspot.com/2012/08/collaborative-filtering-with-graphchi.html


5. scikit-learn

scikit-learn项目主页:http://scikit-learn.org/stable/


6. libNMF

libNMF项目主页:http://www.univie.ac.at/rlcta/software/


7. lbfgs

lbfgs早期版本(Fortran实现):http://www.ece.northwestern.edu/~nocedal/lbfgs.html

c实现版本:http://www.chokkan.org/software/liblbfgs/

版权声明:本文为博主原创文章,未经博主允许不得转载。 举报

相关文章推荐

Text Line Dereplication BigData Tool 文本行去重化 大数据工具 130Gb 20亿行数据 60分钟即可完成去重操作 最快的单机版软件

Text Line Dereplication BigData Tool 文本行去重化 大数据工具 本软件特点及其描述: 1.平均处理速度60Mb/s(读写速度),例如130Gb的txt文件,大约60...

一共81个,开源大数据处理工具汇总

原文出处: 36大数据:一共81个,开源大数据处理工具汇总(上) 36大数据:一共81个,开源大数据处理工具汇总(下),包括日志收集系统/集群管理/RPC等第一部分查询引擎一、Phoenix贡献者...

我是如何成为一名python大咖的?

人生苦短,都说必须python,那么我分享下我是如何从小白成为Python资深开发者的吧。2014年我大学刚毕业..

速度收藏 | 100+大数据开源处理工具汇总

本文除了一些常用的大数据工具,还总结汇总了其他大数据工具,几乎是最全的大数据工具的总结;如果你想入门大数据,可以对他们进行简单的了解;如果你想学习自己熟悉意外的大数据工具,可以看这篇文章;如果你想选择...

开源大数据处理工具汇总(二)

日志收集系统 一、Facebook Scribe 贡献者:Facebook 简介:Scribe是Facebook开源的日志收集系统,在Facebook内部已经得到大量的应用。...

最佳开源大数据工具-2015

1. Spark 在Apache的大数据项目中,Spark是最火的一个,特别是像IBM这样的重量级贡献者的深入参与,使得Spark的发展和进步速度飞快。 与Spark产生最甜蜜...

Hadoop和大数据:60款顶级开源工具

说到处理大数据的工具,普通的开源解决方案(尤其是Apache Hadoop)堪称中流砥柱。弗雷斯特调研公司的分析师Mike Gualtieri最近预测,在接下来几年,“100%的大公司”会采用Hado...

Bossie Awards 开源大数据工具最佳列表

在最佳开源大数据工具奖中,Google的TensorFlow和Beam无可置疑的入选,同时也有Spark,Elasticsearch,Impala,Kylin,Kafka,Zeppelin等市场热点,...

大数据的顶级开源工具

大数据的顶级开源工具:          大数据方面的顶级开源工具,分为四个领域:数据存储,开发平台,开发工具和集成,分析和报告工具。 随着大数据与预测分析的成熟,开源作为底层技术授权解决方案的最大贡...

大数据生态之开源工具简介

大数据生态之开源工具简介说是搞大数据,其实只能叫做水大数据,也水了两年多了。个人对大数据的理解主要简单地分为两个大方向吧,一个是算法(机器学习,深度学习),另外一个就是开发工具,从hadoop到yar...
  • bagba
  • bagba
  • 2016-06-16 19:23
  • 687
返回顶部
收藏助手
不良信息举报
您举报文章:深度学习:神经网络中的前向传播和反向传播算法推导
举报原因:
原因补充:

(最多只允许输入30个字)