关于hadoop学习常识

以下是我从各个网站截图和官网文档找到的资料,仅供学习使用

 

 

 

 

 

以下是hadoop的发展和应用史说不定面试的话多少要了解

1.    这一切,都起源自Web数据爆炸时代的来临

2.    数据抓取系统 - Nutch

3.    海量数据怎么存,当然是用分布式文件系统 - HDFS

4.    数据怎么用呢,分析,处理

5.    MapReduce框架,让你编写代码来实现对大数据的分析工作

6.    非结构化数据(日志)收集处理 - fuse,webdav, chukwa, flume, Scribe
7.    数据导入到HDFS中,至此RDBSM也可以加入HDFS的狂欢了 - Hiho, sqoop
8.    MapReduce太麻烦,好吧,让你用熟悉的方式来操作Hadoop里的数据 – Pig, Hive, Jaql
9.    让你的数据可见 - drilldown, Intellicus
10.  用高级语言管理你的任务流 – oozie, Cascading 
11.  Hadoop当然也有自己的监控管理工具 – Hue, karmasphere, eclipse plugin, cacti, ganglia 
12.  数据序列化处理与任务调度 – Avro, Zookeeper 
13. 更多构建在Hadoop上层的服务 – Mahout, Elastic map Reduce 
14. OLTP存储系统 – Hbase

转载于:https://www.cnblogs.com/waterfox/p/3399461.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值