1.什么是hadoop
分布式大数据平台
mysql 工作原理:架构cs/bs
通过网络发送
server client
通过软件编写一个数据库
服务端server
客户端client
如此建立的数据库的弊端:无法扩容内存,数据只存储在server,抗压能力弱
因此hadoop分布式大数据平台是更好的选择
2.hadoop里面有那些主件
hdfs-----分布式文件系统
hive-----数据仓库
HBase------分布式数据库
(1)搭建hadoop
master -----主节点 ------内存4500MB CPU---1 硬盘40G
svlave -----从节点 ------内存2500MB CPU---1 硬盘40G
yum install wget
wget http://public-repo-1.hortonworks.com/ambari/centos6/2.x/updates/2.0.1/ambari.repo