为了能够保存亿级以上的数据,并能够快速进行查询,考虑使用HBase。
1、Mysql在数据上千万以后,维护起来就已经很困难了。
2、Hive查询效率较低。
3、HBase能够结合很多第三方组件实现类SQL查询,基本能够满足要求。
为了使用HBase,需要搭建最少三节点的Hadoop。
具体步骤为:
一、首先安装一台服务器,安装JDK
二、安装Hadoop
三、安装zookeeper
四、创建配置集群
五、验证集群可用性
六、安装HBase
在配置前,首先进行确定各服务功能设定。
考虑高可用性,Namenode需要2台,zookeeper需要三个。
由于Hadoop极易扩展,我规划的核心服务器均为Dell机架式服务器,Raid50,双CPU,内存128G。
后面需要的化随时添加Datanode。
三台服务器,均安装zookeeper,其中2台做Namenode,全部配置为Datanode。
规划完毕后续开始动手安装…