一个开始

知识就是力量,在我们这个信息爆炸的时代,知识可以认为就是数据。
各行各业的数据都在爆炸式的增长,这个量变已经使我们无法轻松的使用数据了。随之而来的就是大数据领域的解决方案。
hadoop作为一个开源的技术正在被更多的人使用,已经形成一套标准。
hadoop.apache
目标:通过学习,能够完成一定的大数据解决方案

目前hadoop已经形成了一个庞大的家族,相关产品还有如下:
这里写图片描述
个人理解:
hadoop:一个开源的分布式计算框架,主要包含一个分布式文件系统(hdfs)和一个数据分治合并计算框架(mapreduce),基于文件的计算
hive:将文件映射为一个类似数据仓库的东西,能够使用sql做查询统计分析
hbase:高可靠性,高性能,面向列的,分布式的存储系统。能够存储大规模的结构化数据
sqoop:一个转换工具,将关系型的数据(mysql,Oracle。。)导进hdfs,或者从hdfs导进关系型数据库
zookeeper:不好说,起到管理协调数据的作用
pig:可以将类似sql的查询转换并优化为mapreduce的计算

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值