一些单机处理大数据开源工具

原创 2013年12月01日 22:28:11

1. LibFM

项目主页:http://www.libfm.org/


2. Svdfeature

项目主页:http://apex.sjtu.edu.cn/apex_wiki/svdfeature


3. Libsvm和Liblinear

libsvm项目主页:http://www.csie.ntu.edu.tw/~cjlin/libsvm/

liblinear项目主页:http://www.csie.ntu.edu.tw/~cjlin/liblinear/

初次使用必读:practical guide

libsvm的开发心得by林智仁:http://www.csie.ntu.edu.tw/~cjlin/talks/kdd.pdf


4. rt-rank

项目主页:http://research.engineering.wustl.edu/~amohan/

rt-rank中实现了推荐系统中常见的random forests和gradient boosted decision trees这两种方法,使用起来很方便。


3. Mahout

项目主页:http://mahout.apache.org/


4. MyMediaLite

项目主页:http://www.ismll.uni-hildesheim.de/mymedialite/


4. GraphLab 和 GraphChi

GraphLab项目主页:http://graphlab.org/ 

GraphChi项目主页:http://graphlab.org/graphchi/

GraphChi的下载地址:https://code.google.com/p/graphchi/downloads/detail?name=graphchi_src_v0.1.2_toolkits.tar.gz

GraphChi介绍:http://www.technologyreview.com/news/428497/your-laptop-can-now-analyze-big-data/?nlid=nldly&nld=2012-07-17

CF for GraphChi: http://bickson.blogspot.com/2012/08/collaborative-filtering-with-graphchi.html


5. scikit-learn

scikit-learn项目主页:http://scikit-learn.org/stable/


6. libNMF

libNMF项目主页:http://www.univie.ac.at/rlcta/software/


7. lbfgs

lbfgs早期版本(Fortran实现):http://www.ece.northwestern.edu/~nocedal/lbfgs.html

c实现版本:http://www.chokkan.org/software/liblbfgs/

相关文章推荐

Text Line Dereplication BigData Tool 文本行去重化 大数据工具 130Gb 20亿行数据 60分钟即可完成去重操作 最快的单机版软件

Text Line Dereplication BigData Tool 文本行去重化 大数据工具 本软件特点及其描述: 1.平均处理速度60Mb/s(读写速度),例如130Gb的txt文件,大约60...

100+大数据开源处理工具汇总

本文除了一些常用的大数据工具,还总结汇总了其他大数据工具,几乎是最全的大数据工具的总结。 如果你想入门大数据,可以对他们进行简单的了解。 如果你想学习自己熟悉意外的大数据工具,可以看这篇文...
  • lzhiwei
  • lzhiwei
  • 2017年07月10日 16:33
  • 585

一共81个,开源大数据处理工具汇总(上)

http://www.36dsj.com/archives/24852 一共81个,开源大数据处理工具汇总(上)  Optimus Prime 2015-03-11 12:01...

一共81个,开源大数据处理工具汇总

原文出处: 36大数据:一共81个,开源大数据处理工具汇总(上) 36大数据:一共81个,开源大数据处理工具汇总(下),包括日志收集系统/集群管理/RPC等第一部分查询引擎一、Phoenix贡献者...

开源大数据处理工具汇总(下),包括日志收集系统/集群管理/RPC等

开源大数据处理工具汇总(下),包括日志收集系统/集群管理/RPC等 http://www.36dsj.com/archives/25042 第二部分主要收集整理的内容主要有日志...
  • zengwk
  • zengwk
  • 2016年07月05日 11:40
  • 681

一共81个,开源大数据处理工具汇总

作者:大数据女神-诺蓝(微信公号:dashujunvshen)。本文是36大数据专稿,转载必须标明来源36大数据。 本文一共分为上下两部分。我们将针对大数据开源工具不同的用处来进行分类,并且附上...

一共81个,开源大数据处理工具汇总(上)

作者:大数据女神-诺蓝(微信公号:dashujunvshen)。本文是36大数据专稿,转载必须标明来源36大数据。 本文一共分为上下两部分。我们将针对大数据开源工具不同的用处来进行分类,并且附上了官...

一共81个,开源大数据处理工具汇总

 接上一部分:一共81个,开源大数据处理工具汇总(上),第二部分主要收集整理的内容主要有日志收集系统、消息系统、分布式服务、集群管理、RPC、基础设施、搜索引擎、Iaas和监控管理等大数据开源工...

一共81个,开源大数据处理工具汇总(下),包括日志收集系统/集群管理/RPC等

http://www.36dsj.com/archives/25042 一共81个,开源大数据处理工具汇总(下),包括日志收集系统/集群管理/RPC等  诺蓝 2015-03-...

速度收藏 | 100+大数据开源处理工具汇总

本文除了一些常用的大数据工具,还总结汇总了其他大数据工具,几乎是最全的大数据工具的总结;如果你想入门大数据,可以对他们进行简单的了解;如果你想学习自己熟悉意外的大数据工具,可以看这篇文章;如果你想选择...
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:一些单机处理大数据开源工具
举报原因:
原因补充:

(最多只允许输入30个字)