![](https://img-blog.csdnimg.cn/20201014180756919.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
大数据 --- Hive
草莓味的甜
这个作者很懒,什么都没留下…
展开
-
Hive笔记 ---之hive 分区表 分桶表 详解
--- 本章节目录分区表 (静态分区 动态分区)分桶表抽样查询分区表 数据分区的概念以及存在很久了,通常使用分区来水平分散压力,将数据从物理上移到和使用最频繁的用户更近的地方,以及实现其目的hive中处理的数据在HDFS中 , select * from tb_name where dt=2020-09-03;查询表中的数据是加载HDFS中对应表文件夹下的数据 ,文件夹下的数据很多,将数据全部加载以后再筛选过滤出数据, 显然效率低,Hive中的分区表起始就是根据...原创 2020-09-04 20:35:18 · 464 阅读 · 0 评论 -
Hive -- DDL 数据库 表 基础操作
Hive 数据类型 对于Hive的String类型相当于数据库的varchar类型,该类型是一个可变的字符串,不过它不能声明其中最多能存储多少个字符,理论上它可以存储2GB的字符数--- DDL基础操作 ------ 显示系统中所有的数据库show databases ;+----------------+| database_name |+----------------+| default || demo |+--...原创 2020-09-01 17:20:19 · 262 阅读 · 0 评论 -
Hive是什么 简介 安装部署 连接详解
什么是Hive解决海量结构化日志的数据统计(海量的结构化数据的运算分析)它是一个数仓工具,不是数据库 通过SQL形式 处理,分析,统计,运算HDFS上的海量结构化数据--->报表本质:Hive(HQL)底层转换成MR程序,提交到Yarn分布式运行Hive处理数据存储在HDFS上 Hive分析数据底层的实现是MapReduce/ spark(分布式运算框架) 执行程序运行在Yarn上优点与缺点 简述--- 优点操作接口采用类SQL语法,提...原创 2020-08-31 22:58:23 · 486 阅读 · 0 评论