![](https://img-blog.csdnimg.cn/20201014180756925.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
Hive
文章平均质量分 79
Hive相关内容的学习。
Alfred_XiaJL
路虽远,行则将至;事虽难,做则必成。
展开
-
Hive中常用的函数
6.1 系统内助函数1)查看系统自带的函数hive> show functions;2)显示自带的函数的用法hive> desc function upper;3)详细显示自带的函数的用法hive> desc function extended upper;6.2 常用内置函数6.2.1 空字段赋值1)函数说明NVL:给值为 NULL 的数据赋值,它的格式是 NVL( value,default_value)。它的功能是如果 value 为 NULL,则 NVL原创 2021-12-06 14:44:56 · 352 阅读 · 0 评论 -
Hive之分区表和分桶表
5.1 分区表分区表实际上就是对应一个 HDFS 文件系统上的独立的文件夹,该文件夹下是该分区所有的数据文件。Hive 中的分区就是分目录,把一个大的数据集根据业务需要分割成小的数据集。在查询时通过 WHERE 子句中的表达式选择查询所需要的指定的分区,这样的查询效率会提高很多。1.创建分区表%hivecreate table dept_xjl(deptno int,dname string,loc string)partitioned by (day string)row format de原创 2021-12-04 13:12:22 · 311 阅读 · 0 评论 -
Hive之基本查询(Select...From)
4.1 全表和特定列查询原始数据10 ACCOUNTING 170020 RESEARCH 180030 SALES 190040 OPERATIONS 1700emp:7369 SMITH CLERK 7902 1980-12-17 800.00 207499 ALLEN SALESMAN 7698 1981-2-20 1600.00 300.00 307521 WARD SALESMAN 7698 1981-2-22 1250.00 500.00 3075原创 2021-12-04 13:06:34 · 2181 阅读 · 0 评论 -
Hive之DML 数据操作
3.1数据导入3.1.1 向表中装载数据(Load)(1)语法load data [local] inpath ‘数据的 path’ [overwrite] into tablestudent [partition (partcol1=val1,…)];load data:表示加载数据local:表示从本地加载数据到 hive 表;否则从 HDFS 加载数据到 hive 表inpath:表示加载数据的路径overwrite:表示覆盖表中已有数据,否则表示追加into table:表示加载到原创 2021-12-04 12:51:33 · 279 阅读 · 0 评论 -
Hive之DDL 数据定义
2.1 创建数据库CREATE DATABASE [IF NOT EXISTS] database_name1.创建数据库hive (default)> create database db_hive;2.避免要创建的数据库已经存在错误,增加 if not exists 判断。(标准写法)hive (default)> create database if not exists db_hive;3.创建一个数据库,指定数据库在 HDFS 上存放的位置hive (default)&g原创 2021-12-04 12:42:17 · 979 阅读 · 0 评论 -
Hive中的数据类型
1.1 基本数据类型对于 Hive 的 String 类型相当于数据库的 varchar 类型,该类型是一个可变的字符串,不过它不能声明其中最多能存储多少个字符,理论上它可以存储 2GB 的字符数。1.2 集合数据类型Hive 有三种复杂数据类型 ARRAY、MAP 和 STRUCT。ARRAY 和 MAP 与 Java 中的 Array和 Map 类似,而 STRUCT 与 C 语言中的 Struct 类似,它封装了一个命名字段集合,复杂数据类型允许任意层次的嵌套。...原创 2021-12-04 12:33:13 · 1501 阅读 · 0 评论