Hive

Hive是由Facebook开源的大数据仓库工具,适用于处理海量结构化日志数据。它提供了类SQL查询语言HQL,支持MapReduce、Tez、Spark等多种执行引擎,并且支持多种压缩和存储格式。本文将涵盖Hive的概述、环境搭建过程以及如何创建表并加载数据。
摘要由CSDN通过智能技术生成

大数据数据仓库Hive

概述

  1. 由FaceBook开源, 最初用于解决海量结构化日志数据统计问题
  2. 构建在Hadoop之上的数据仓库
  3. Hive定义了一种类SQL查询语言:HQL
  4. 通常用于进行离线数据处理(MapReduce)
  5. 底层支持多种不同的执行引擎(MapReduce, Tez, Spark)
  6. 支持多种不同压缩格式, 存储格式和自定义函数
    1. 压缩:GZIP, LZP, Snappy, BZIP
    2. 存储:TextFile, SequenceFile, RCFile, ORC, Parquet
    3. UDF: 自定义函数

环境搭建

下载地址

cdh5

配置Hive

hive-site.xml

<configuration>
    <!-- 配置数据库连接参数 -->
    <property>
        <name>javax.jdo.option.ConnectionURL</name>
        <value>jdbc:mariadb://localhost:3306/sparkSQL?createDatabaseIfNotExist=true</value>
    </property>
    <!-- 连接数据库驱动 -->
    <property>
        <name>javax.jdo.option.ConnectionDriverName</name>
        <value>org.mariadb.jdbc.Driver</value>
    </property>
    <!-- 连接数据库用户名 -->
    <property>
        <name>javax.jdo.option.ConnectionUserName</name>
        <value>root</value>
    </property>
    <!-- 密码 -->
    <property>
        <name>javax.jdo.option.ConnectionPassword</name>
        <value>1212</value>
    </property>
</configuration>

注: 需要将连接数据库的驱动包放在Hive安装目录下的/lib下

创建表

CREATE TABLE table_name
​	[(col_name data_type [COMMENT col_comment])]
加载数据到hive表中
LOAD DATA LOCAL INPATH 'filepath' INTO TABLE tablename
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值