大数据的典型工具

1.Hadoop

Hadoop是一个能够对大量数据进行分布式处理的软件框架,是一个能够让用户轻松架构和使用的分布式计算平台。用户可以轻松的在Hadoop上开发和运行处理海量数据的应用程序。

2.Spark

Spark是一个基于内存计算的开源集群计算系统,目的是更快速的进行数据分析。Spark是由加州伯克利大学AMP实验室Matei为主的小团队使用Scala开发的,其核心部分的代码只有63个Scala文件,非常亲轻量级。

3.Storm

Storm是一种开源软件,一个分布式、容错的实时计算系统。Storm可以非常可靠地处理庞大的数据流,用于处Hadoop的批量数据。

4.Apache Drill

通过开发Apache Drill开源项目,组织机构将有望建立Drill所属的API接口和灵活强大的体系架构,从而帮助支持广泛的数据源、数据格式和查询语言。

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值