Hive
chipeize
这个作者很懒,什么都没留下…
展开
-
Hive(数据仓库) Hive 的安装
Hive 的安装 这里我们选用hive的版本是2.1.1下载地址为:http://archive.apache.org/dist/hive/hive-2.1.1/apache-hive-2.1.1-bin.tar.gz 下载之后,将我们的安装包上传到第三台机器的/export/softwares目录下面去 第一步:上传并解压安装包 将我们的hive的安装包上传到第三台服务器的/expo...原创 2019-08-26 20:44:48 · 198 阅读 · 0 评论 -
Hive(数据仓库)数据仓库和 Hive 的基本概念
1. 数据仓库 1.1 基本概念 英文名称为 Data Warehouse,可简写为 DW 或 DWH。数据仓库的目的是构建面相分析的集成化数据环境,为企业提供决策支持(Decision Support)。 数据仓库是存数据的,企业的各种数据往里面存,主要目的是为了分析有效数据,后续会基于它产出供分析挖掘的数据,或者数据应用需要的数据,如企业的分析性报告和各类报表...原创 2019-08-26 20:41:27 · 2477 阅读 · 0 评论 -
Hive(数据仓库) Hive 的交互方式和基本操作
1. Hive 的交互方式 第一种交互方式:bin/hive 第二种交互方式:使用 sql 语句或者 sql 脚本进行交互 2. Hive 的基本操作 2.1 数据库操作 创建数据库: create database if not exists myhive; 创建数据库并指定位置: create database myhive location '/myhi...原创 2019-09-02 20:16:00 · 363 阅读 · 0 评论 -
Hive(数据仓库)Hive 的查询语法、shell参数、函数
4. Hive 查询语法 4.1. SELECT SELECT [ALL | DISTINCT] select_expr, select_expr, ... FROM table_reference [WHERE where_condition] [GROUP BY col_list [HAVING condition]] [CLUSTER BY col_list | [DISTRIBUTE BY...原创 2019-09-02 20:21:02 · 529 阅读 · 0 评论 -
Hive(数据仓库)数据压缩、数据存储格式
7.hive的数据压缩 在实际工作当中,hive当中处理的数据,一般都需要经过压缩,前期我们在学习hadoop的时候,已经配置过hadoop的压缩,我们这里的hive也是一样的可以使用压缩来节省我们的MR处理的网络带宽 **7.1 **MR支持的压缩编码 压缩格式 工具 算法 文件扩展名 是否可切分 DEFAULT 无 DEFAULT .deflate 否 Gzip gzip ...原创 2019-09-02 20:22:55 · 994 阅读 · 0 评论 -
Hive(数据仓库)Hive 调优
10.hive调优 10.1 Fetch抓取 Hive中对某些情况的查询可以不必使用MapReduce计算。例如:SELECT * FROM score;在这种情况下,Hive可以简单地读取score对应的存储目录下的文件,然后输出查询结果到控制台。通过设置hive.fetch.task.conversion参数,可以控制查询语句是否走MapReduce. 案例实操: 1)把hive.fetch....原创 2019-09-02 20:23:36 · 224 阅读 · 0 评论