【二、大数据环境篇】001、方法论

1、官网的文档
无论是学习Hadoop的hdfs、hive,还是hbase等,都要非常看重官网的文档。
大数据的很多框架,都是Apache的顶级项目,各个组件框架的官网链接都可以从下面的链接进入:
  • Avro™: 序列化系统
  • HBase™: 分布式数据库
  • Hive™: 数据仓库
  • Mahout™: 机器学习与数据挖掘库
  • Pig™: 并行计算的高级数据流语言和执行框架.
  • Spark™: 快速和通用计算的Hadoop数据引擎。提供了一个简单而富有表现力的编程模型,支持多种应用,包括ETL、机器学习、数据流处理、图形计算.
  • ZooKeeper™: 分布式应用的高性能协调服务。
更多组件框架,不详。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值