- 博客(3)
- 收藏
- 关注
原创 在PostgreSQL 和 Hive中生成日期序列
在PostgreSQL 和 Hive中生成日期序列Postgresql实现日期序列在postgresql中,有 generate_series(start_date, end_date, interval)函数来生成日期序列select date(day) as day from generate_series('2020-05-22'::timestamp, current_date, '1 day'::interval) as dayHive实现指定指定开始结束日期的日期序列在Hive中,
2020-06-30 23:40:15 1031
原创 Hive 创建不同压缩方式的ORC存储格式表
目录创建一个非压缩的的ORC存储方式表创建一个snappy压缩的ORC存储方式表创建一个ZLIB压缩的ORC存储方式表(默认方式)存储方式和压缩总结使用压缩的优势是可以最小化所需要的磁盘存储空间,以及减少磁盘和网络io操作ORC支持三种压缩:ZLIB,SNAPPY,NONE。最后一种就是不压缩,orc默认采用的是ZLIB压缩。创建一个非压缩的的ORC存储方式表create table log_orc_none (track_time string,url
2020-06-29 14:57:49 2918 1
原创 安装伪分布式Hadoop (Mac OS X)
目录Hadoop安装配置介绍伪分布式Hadoop安装1.安装Java JDK2. SSH 配置3. 安装Hadoop官网下载HDFS配置4.添加Hadoop环境变量5.运行Hadoop + 查看远端格式化一个新的分布式文件系统DFS(即对namenode初始化)启动dfs文件系统(开启保护进程)查看远端(Hadoop端口)关闭伪分布式6...
2019-04-22 00:36:56 875 1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人