Hive
hi枫林客
这个作者很懒,什么都没留下…
展开
-
【Hive从入门到精通之开门篇】Hive的安装配置
1、Hive的来源与介绍1)Hive是由Facebook开源用于解决海量结构化日志的数据统计。2)Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张表,并提供类SQL查询功能。3)总结一句话,Hive的本质是:将HQL转化成MapReduce程序。4)Hive处理的数据我们一般存储在分布式文件系统HDFS上,由于其执行底层会转换成MapReduce程序,...原创 2019-08-28 23:35:05 · 446 阅读 · 0 评论 -
【Hive从入门到精通之基础篇】Hive的基本命令行操作和常用的交互命令
1、Hive的基本命令行操作(1)启动hive默认的命令行客户端bin/hive(2)查看数据库列表show databases;(3)使用默认数据库use default;(4)查看该数据库下有几张表show tables;(5)这里我们可以在default数据库下面创建一张表studentcreate table if not exis...原创 2019-08-29 00:27:02 · 513 阅读 · 0 评论 -
【Hive从入门到精通之基础篇】配置通过远程Jdbc方式连接之HiveServer2
1、首先需要配置hive-site.xml文件(1)hive.server2.thrift.port --端口号:10000(2)hive.server2.thrift.bind.host --绑定主机名称为hive安装的那台节点主机名(3)hive.server2.long.polling.timeout -- 超时时间为5000,去掉L<!-- 配置hive serve...原创 2019-08-29 00:42:05 · 945 阅读 · 0 评论 -
【Hive从入门到精通之基础篇】Hive的数据类型分类
1、基本数据类型1)Hive的基本数据类型对比Java的数据类型Hive的数据类型 Java的数据类型 长度 tinyint byte 1个字节,有符号整数 smalint short 2个字节,有符号整数 int int 4个字节,有符号整数 bigint long 8个字节,有符号整数 boolean ...原创 2019-08-29 01:07:51 · 479 阅读 · 0 评论 -
【Hive从入门到精通之基础篇】Hive的内部表与外部表区别与使用场景
1、Hive的内部表(管理表)(1)基本概念:在Hive中,默认创建的表都是管理表(内部表),它与表的原始数据息息相关,Hive默认情况下会将管理表的数据存储在由配置参数hive.metastore.warehouse.dir指定的HDFS目录下(/user/hive/warehouse/),当删除管理表时,会删除表的元数据并连同表的原始数据一起删除(所以管理表不适合与其它工具来共享数据)。...原创 2019-09-16 23:14:33 · 742 阅读 · 0 评论 -
【Hive从入门到精通之基础篇】Hive的分区表(比较重要,开发必用)
1、何为分区表(1)基本概念:在Hive中,分区表的意思就是相当于在该表对应的文件夹目录下创建子目录来存储不同该表分区字段对应的数据(简单一句话总结就是hive中的分区表就是分目录存储数据,将一个表的所有数据根据业务来切分成一个个小的数据集来存储)。(2)分区表数据的查询通过where关键字来指定分区字段来进行查询,这样可以提高查询的效率。2、分区表的基本操作(1)创建分区表的语法...原创 2019-09-17 00:06:42 · 607 阅读 · 0 评论