Jubatus: 分布式在线机器学习框架

Jubatus [url]http://jubat.us/en/overview.html[/url] 是一个面向大数据数据流的分布式在线机器学习的开源框架,和storm有些类似,但是从介绍上来看,它提供了更多的功能。
Jubatus认为未来的数据分析平台应该同时向三个方向展开:处理更大的数据,深层次的分析和实时处理;而当前还没有一种能够处理不断生成的流式大数据的水平可扩展的分布式架构。Hadoop的mapreduce能够处理大数据,但不能做复杂的机器学习算法;Apache Mahout是基于Hadoop的机器学习平台,但不适用于在线处理数据流。
Jubatus将在线机器学习,分布式计算和随机算法等的优势结合在一起用于机器学习,并支持分类,回归,推荐等基本元素。根据其设计目的,Jubatus有如下的特点:
[list]
[*]可扩展:支持可扩展的机器学习处理。在普通硬件集群上处理数据速度高达100000条/秒
[*]实时计算:实时分析数据和更新模型
[*]深层次的数据分析:支持各种分析计算:分类,回归,统计,推荐等
[/list]
Jubatus还是一个很年轻的项目,当前最新的发布版本是0.3.2(c++), 但暂时还没有看到有商业使用的例子;如果有基于流数据的机器学习方面的需求,还是关注一下的。
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值