Hive

最新推荐文章于 2024-10-17 15:34:15 发布

EugeoY

最新推荐文章于 2024-10-17 15:34:15 发布

阅读量92

点赞数

文章标签：大数据 hive

本文链接：https://blog.csdn.net/qq_41796895/article/details/103197092

版权

Hive是由Facebook开源的大数据仓库工具，适用于处理海量结构化日志数据。它提供了类SQL查询语言HQL，支持MapReduce、Tez、Spark等多种执行引擎，并且支持多种压缩和存储格式。本文将涵盖Hive的概述、环境搭建过程以及如何创建表并加载数据。

摘要由CSDN通过智能技术生成

大数据数据仓库Hive

概述

由FaceBook开源, 最初用于解决海量结构化日志数据统计问题
构建在Hadoop之上的数据仓库
Hive定义了一种类SQL查询语言:HQL
通常用于进行离线数据处理(MapReduce)
底层支持多种不同的执行引擎(MapReduce, Tez, Spark)
支持多种不同压缩格式, 存储格式和自定义函数
1. 压缩:GZIP, LZP, Snappy, BZIP
2. 存储:TextFile, SequenceFile, RCFile, ORC, Parquet
3. UDF: 自定义函数

环境搭建

下载地址

cdh5

配置Hive

hive-site.xml

<configuration>
    <!-- 配置数据库连接参数 -->
    <property>
        <name>javax.jdo.option.ConnectionURL</name>
        <value>jdbc:mariadb://localhost:3306/sparkSQL?createDatabaseIfNotExist=true</value>
    </property>
    <!-- 连接数据库驱动 -->
    <property>
        <name>javax.jdo.option.ConnectionDriverName</name>
        <value>org.mariadb.jdbc.Driver</value>
    </property>
    <!-- 连接数据库用户名 -->
    <property>
        <name>javax.jdo.option.ConnectionUserName</name>
        <value>root</value>
    </property>
    <!-- 密码 -->
    <property>
        <name>javax.jdo.option.ConnectionPassword</name>
        <value>1212</value>
    </property>
</configuration>

注: 需要将连接数据库的驱动包放在Hive安装目录下的/lib下

创建表

CREATE TABLE table_name
	[(col_name data_type [COMMENT col_comment])]

加载数据到hive表中

LOAD DATA LOCAL INPATH 'filepath' INTO TABLE tablename

EugeoY

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫