Hadoop、hive、hbase之间的关系(只適合新手看看,因為我自己剛接觸的時候分不清這三個是什麼)
Hive和hbase都是数据库,底层文件的存贮都是依赖hdfs的。(hbase也可以有自己的文件存贮方式),这个是关系。Hive和hbase的区别在于,数据的用途不同,hive倾向于数据分析,hbase倾向于大数据的实时操作。
Hive是通过什么和hadoop联系起来的?
/hadoop/hive/apache-hive-3.1.2-bin/bin/hive
Hive对应的bin文件里面包含了寻找hadoop。
# check for hadoop in the path HADOOP_IN_PATH=`which hadoop 2>/dev/null` if [ -f ${HADOOP_IN_PATH} ]; then HADOOP_DIR=`dirname "$HADOOP_IN_PATH"`/.. fi # HADOOP_HOME env variable overrides hadoop in the path HADOOP_HOME=${HADOOP_HOME:-${HADOOP_PREFIX:-$HADOOP_DIR}} if [ "$HADOOP_HOME" == "" ]; then echo "Cannot find hadoop installation: \$HADOOP_HOME or \$HADOOP_PREFIX must be set or hadoop must be in the path"; exit 4; fi |
如果hive-site.xml中没有和hadoop相关的内容的话,估计就只有这里将两个串联起来了。如果是通过hive的bin文件关联的话,应该hadoop和hive只能安装在同一台。
Hbase是通过什么和hadoop(hdfs)关联起来的?
/hadoop/hbase/hbase-2.2.4/conf/hbase-site.xml
个人认为,应该是通过hbase-site.xml中的hbase.rootdir参数来决定的。
<name>hbase.rootdir</name>