苏先生关于数据仓库hive(一)

hive与传统数据库相比:
在这里插入图片描述

Hive简介

Hive 是一个基于 hadoop 的开源数据仓库工具,用于存储和处理海量结构化数据。它把海量数据存储于 hadoop 文件系统,而不是数据库,但提供了一套类数据库的数据存储和处理机制,并采用 HQL (类 SQL )语言对这些数据进行自动化管理和处理。我们可以把 Hive 中海量结构化数据看成一个个的表,而实际上这些数据是分布式存储在 HDFS 中的。 Hive 经过对语句进行解析和转换,最终生成一系列基于 hadoop 的 map/reduce 任务,通过执行这些任务完成数据处理。

Hive的安装部署

该部分的安装需要在Hadoop已经成功安装的基础上,并且要求Hadoop已经正常启动,并且成功安装MySQL。Hadoop正常启动的验证过程如下:
(1)使用下面的命令,看可否正常显示HDFS上的目录列表
[hadoop@master ~]$ hdfs fs -ls /
(2)使用浏览器查看相应界面
http://master:50070
http://master:18088
该页面的结果跟Hadoop安装部分浏览器展示结果一致。如果满足上面的两个条件,表示Hadoop正常启动。
我们将Hive安装在master节点上。所以下面的所有操作都在master节点上进行,并且所有的操作都使用hadoop用户。

  1. 解压hive的安装包,tar -zxvf ~/apache-hive-0.13.1-bin.tar.gz
  2. 在mysql中创建hive_meta数据库用来存储hive的元数据
  3. 修改hive的配置文件hive-site.xml,将下面的内容添加到hive-site.xml文件中:
  <property>
      <name>hive.metastore.local</name>
      <value>true</value>
  </property>
  <property>
      <name>javax.jdo.option.ConnectionURL</name>
       <value>jdbc:mysql://master:3306/hive_meta?characterEncoding=UTF-8</value>
  </property>
  <property>
      <name>javax.jdo.option.ConnectionDriverName</name>
      <value>com.mysql.jdbc.Driver</value>
  </property> 
  <property>
      <name>javax.jdo.option.ConnectionUserName</name>
      <value>root</value>
  </property>
  <property>
      <name>javax.jdo.option.ConnectionPassword</name>
      <value>root</value>
  </property> 
  1. 将mysql的驱动包放到hive的lib目录下
  2. 配置hive的环境变量

    export HIVE_HOME=/opt/apache-hive-0.13.1-bin export
    PATH=$PATH:$HIVE_HOME/bin

  3. 启动并验证Hive的安装
    在这里插入图片描述
    安装完毕!
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值