hive
hive
人间小鲸鱼
这个作者很懒,什么都没留下…
展开
-
Hive QL操作
Hive QL操作6.1 SELECT…FROM 语句SELECT是SQL中的射影算子,FROM子句标识了从哪个表、视图或嵌套查询中选择记录。对于一个给定的记录,SELECT指定了要保存的列以及输出函数需要调用的一个或多个列(例如,像count(*)这样的聚合函数)6.1.1使用正则表达式指定列create table logs( uuid string, userid string , fromUrl string , dateString string,原创 2020-06-22 09:08:40 · 281 阅读 · 0 评论 -
Hive表分类,内部表、外部表、分区表简介
Hive表分类5.1 管理表(内部表)内部表与数据库中的Table在概念上是类似的,每一个内部Table在Hive中都有一个相应目录存储数据,所有的Table数据(不包括External Table)都保存在这个目录中。删除表时,元数据与数据都会被删除。5.2 外部表在创建表的时候可以指定external关键字创建外部表,外部表对应的文件存储在location指定的目录下,向该目录添加新文件的同时,该表也会读取到该文件(当然文件格式必须跟表定义的一致),删除外部表的同时并不会删除location指定原创 2020-06-19 08:42:54 · 500 阅读 · 0 评论 -
Hive概述与表操作
一、概述由Facebook开源用于解决海量结构化日志的数据统计工具。Hive是建立在 Hadoop 上的数据仓库基础构架。它提供了一系列的工具,可以用来进行数据提取转化加载(ETL),这是一种可以存储、查询和分析存储在 Hadoop 中的大规模数据的机制。 Hive 查询操作过程严格遵守Hadoop MapReduce 的作业执行模型,Hive 将用户的HiveQL 语句通过解释器转换为提交到Hadoop 集群上,Hadoop 监控作业执行过程,然后返回作业执行结果给用户。 Hive 并非为联机事务处理原创 2020-06-18 08:48:47 · 345 阅读 · 0 评论