hive
文章平均质量分 55
JinVijay
这个作者很懒,什么都没留下…
展开
-
Hive分区表和分桶表
分区表分区表实际上就是对应一个HDFS文件系统上的独立的文件夹,该文件夹下是该分区所有的数据文件.Hive中的分区就是目录,把一个大的数据集根据业务需要分割成小的数据集.在查询是通过WHERE子句中的表达式选择查询需要的指定的分区,这样的查询效率会提高很多将表中的数据以某种维度进行划分文件夹管理,当要查询数据的时候,根据维度直接加载对应文件夹下的数据!不用加载整张表所有的数据再进行过滤,从而提升处理数据的效率!静态分区一级静态分区演示数据准备bj.csv1,zs,bj2,ls,原创 2022-02-09 20:21:22 · 950 阅读 · 0 评论 -
Hive数据导入和导出
数据的导入1.直接将数据放到表目录下hdfs dfs -cp /data/user/*.csv hdfs://mydfs/user/hive/warehouse/myhive.db/tb_managed_user-put -mv 操作也可以2.向表中装载数据( load )--装载本地数据load data local inpath '/data/user.csv' into table tb_managed_user ;--装载HDFS的数据 相当于将数据移动到表目录原创 2022-02-09 16:49:24 · 923 阅读 · 0 评论 -
Hive管理表(内部表),外部表
默认创建的表都是所谓的管理表,有时也被称为内部表。因为这种表,Hive会(或多或少地)控制着数据的生命周期。Hive默认情况下会将这些表的数据存储在由配置项hive.metastore.warehouse.dir(例如,/user/hive/warehouse)所定义的目录的子目录下。 当我们删除一个管理表时,Hive也会删除这个表中数据。管理表不适合和其他工具共享数据。因为表是外部表,所以Hive并非认为其完全拥有这份数据。删除该表并不会删除掉这份数据,不过描述表的元数据信息会被删除掉。 在hi原创 2022-02-09 15:44:45 · 1150 阅读 · 0 评论 -
Hive基本语法
--建表语法CREATE [EXTERNAL] TABLE [IF NOT EXISTS] table_name [(col_name data_type [COMMENT col_comment], ...)] [COMMENT table_comment] [PARTITIONED BY (col_name data_type [COMMENT col_comment], ...)] 分区[CLUSTERED BY (col_name, col_name, ...) 分桶[SORTED B.原创 2022-02-09 11:53:50 · 1016 阅读 · 0 评论 -
Hive安装部署
1.Hive安装地址1.Hive官网地址Apache Hive TM2.文档查看地址GettingStarted - Apache Hive - Apache Software Foundation3.下载地址Index of /dist/hive4.github地址https://github.com/apache/hive原创 2022-02-09 10:06:05 · 796 阅读 · 0 评论