![](https://img-blog.csdnimg.cn/20201014180756754.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
Hive编程指南阅读笔记
文章平均质量分 60
通过Hive编程指南来学习Hive
秃秃兔233
我很懒,也很菜。
展开
-
Hive 索引
文章目录1.创建索引2.重建索引3.显示索引4.删除索引5.定制一个索引处理器1.创建索引 create index `index_name` on table `tbl_name`(attr) # 建立索引 as '索引处理器的全包名' # 指定索引处理器 with deferred rebuild # 指明在任何时候都可以进行索引创建和使用alter index idxproperties(k = v) # 附加属性 in table `index_store_table_n原创 2021-08-15 16:21:38 · 652 阅读 · 0 评论 -
Hive视图
文章目录1.创建视图2.删除视图3.修改视图4.查看视图1.创建视图Hive目前并不支持物化视图。 create view as select_statement2.删除视图 drop view if exists `tbl_name`3.修改视图视图是只读的,只能修改属性。 alter view `view_name` set tblproperties(key = value)4.查看视图视图结构的查看和表的查看方式是相同的。...原创 2021-08-12 19:08:51 · 486 阅读 · 0 评论 -
第六章 HiveQL查询
文章目录1.select...from语句1.从map,struct,array中取数据2.使用正则表达式来指定列的值3.可以对列值进行函数调用与算术表达式计算3.1算术表达式类型4.limit语句5.case...when...then6.什么情况下hive不会进行mapreduce2. where语句1逻辑运算符2关于浮点数的比较3.like和RLike3.group by 语句hiving 语句4. Join语句1.内连接(inner join)2.左外连接(left out join)1.sele原创 2021-08-10 18:23:20 · 392 阅读 · 0 评论 -
第五章 HiveQL数据操作
文章目录5.1向管理表中装载数据5.2 通过查询语句向表中插入数据Hive中没有行级别的插入,更新和删除操作。唯一向Hive中进行插入数据的方法是数据装载操作,或者通过其他方式将数据写入到正确的目录当中。5.1向管理表中装载数据 load data [local] inpath 'path' [overwrite] into table `tbl_name` [partition(...)] local: 表示为本地文件系统,将本地文件拷贝到分布式文件系统中 没有使用local则将数原创 2021-08-05 17:38:59 · 116 阅读 · 0 评论 -
分区表
目录1. 建立分区表的语句2.插入2.1 静态分区插入数据2.2 动态分区插入数据3.查看分区信息4.删除分区什么是分区表? 分区表是将较大的数据集,按分区字段进行分开存储,已达到优化查询速度的目的,在Hive中就是采用划分目录的策略来达到分区划分的目的。 Hive的一个分区名对应一个目录名,子分区名就是子目录名,并不是一个实际字段。什么是动态分区(DP dynamic partition)和静态(SP原创 2021-08-03 19:01:25 · 252 阅读 · 0 评论 -
第四章 HiveQL:数据定义
文章目录4.0 绪论4.1 Hive中的数据库4.2 修改数据库4.0 绪论Hive不支持行级别的插入操作,更新操作和删除操作。4.1 Hive中的数据库Hive数据库本质上是表的一个目录或者说是命名空间。如果用户没有指定使用的数据库,那么就会使用default数据库。创建一个数据库Hive为每个数据库创建一个目录,数据库中的表是以子目录的形式存储的。数据库所在默认目录位于属性hive.metastore.warehouse.dir所指定的目录。 create databas原创 2021-07-25 19:18:14 · 87 阅读 · 0 评论 -
第三章 数据类型和文件格式
文章目录3.1 基本数据类型3.2集合数据类型3.3 文本文件数据编码3.4 读时模式3.1 基本数据类型数据类型长度tinyint1bytesmallint2byteint4bytelong8bytefloat单精度浮点数double双精度浮点数string字符串timestamp时间戳类型binary字节数组tips:一个表指定的数据只有三列,假如数据文件中一行的数据有五列。那么HIVE会自动忽略后面两列原创 2021-07-27 19:31:10 · 231 阅读 · 0 评论