Hive
街角不冷
这个作者很懒,什么都没留下…
展开
-
数仓工具hive(六):Hive中常用函数汇总
常用日期函数 unix_timestamp:返回当前或指定时间的时间戳 from_uni xtime:将时间戳转为日期格式 current_date:当前日期 current_timestamp:当前的日期加时间 to_date:抽取日期部分 year:获取年 month:获取月 day:获取日 hour:获取时 minute:获取分 second:获取秒 weekofyear:当前时间是一年中的第几周 dayofmonth:当前时间是一个月中的第几天 months_between: 两个日期间的月原创 2020-05-18 11:31:31 · 386 阅读 · 0 评论 -
数仓工具hive(四):Hive文件存储格式以及优缺点
前言 Hive支持的存储数的格式主要有:TEXTFILE 、SEQUENCEFILE、ORC、PARQUET。 行与列存储的特点 行存储的特点 查询满足条件的一整行数据的时候,列存储则需要去每个聚集的字段找到对应的每个列的值,行存储只需要找到其中一个值,其余的值都在相邻地方,所以此时行存储查询的速度更快。 列存储的特点 因为每个字段的数据聚集存储,在查询只需要少数几个字段的时候,能大大减少读取的数据量;每个字段的数据类型一定是相同的,列式存储可以针对性的设计更好的设计压缩算法。 Hive文件存储格式以及优缺原创 2020-05-18 11:28:36 · 1812 阅读 · 0 评论 -
数仓工具hive(二):安装部署
Hive安装地址 Hive官网地址 文档查看地址 下载地址 Hive安装部署 Hive安装及配置 把apache-hive-1.2.1-bin.tar.gz上传到linux的/opt/software目录下 解压apache-hive-1.2.1-bin.tar.gz到/opt/module/目录下面 [root@hadoop102 software]$ tar -zxvf apache-hive-1.2.1-bin.tar.gz -C /opt/module/ 修改apache-hive-1.原创 2020-05-18 11:27:13 · 256 阅读 · 0 评论 -
数仓工具Hive(一):起源
what is hive 官方文档 The Apache Hive ™ data warehouse software facilitates reading, writing, and managing large datasets residing in distributed storage using SQL. Structure can be projected onto data ...原创 2020-03-31 09:08:53 · 179 阅读 · 0 评论 -
Ambari+HDP安装的Hive出现中文乱码解决
1 Hive注释comment出现乱码 1.1 Hive建表语句 create table test.mytest_tm1( id int comment'编号', name string comment '名字' ) row format delimited fields terminated by '\u00...原创 2020-03-19 17:39:28 · 440 阅读 · 0 评论