hive
文章平均质量分 63
未知之谜
数据的魅力
展开
-
Hive SQL学习之路--知识点1
Hive SQL学习之路–知识点1 split函数 1.用法 split(str,regex) 将字符串按照regex进行分割成字符串数组常见用法: select split(‘http://sale.jd.com/act/dfsdg.html‘,’/’) 结果:[“http:”,”“,”sale.jd.com”,”act”,”dfsdg.html”]select split(‘原创 2016-11-25 13:21:49 · 395 阅读 · 0 评论 -
Hive SQL学习之路--知识点2
笔者在编写hive sql进行引入订单分类统计开发中,碰到了一些坑,也积累了一定的经验。 1.表需要添加字段,然后重新跑数据,发现写入的数据与对应的列对不上 过程: 1-1 使用alter语句操作表 //增加三级分类id信息 ALTER TABLE table1 ADD COLUMNS (item_first_cate_cd string comment ‘一级分类编码’, item_s原创 2016-11-29 19:25:33 · 1770 阅读 · 0 评论 -
hive的安装
本次安装,是在hadoop的集群上,进行安装hive原创 2016-12-19 13:30:44 · 225 阅读 · 0 评论 -
hive拉链表和增量表
http://lxw1234.com/archives/2015/08/473.htm原创 2017-02-10 11:21:24 · 6175 阅读 · 0 评论 -
HIVE脚本优化
1.写HIVE脚本时,要善于使用multi-insert语法 insert into(或者overwrite) table1 partition(dt = ‘2017-11-02’) select a, b from app.app_m04_order_info //增量表 where dt >= sysdate原创 2017-11-02 14:08:23 · 1176 阅读 · 0 评论 -
HIVE存储格式
TextFileHive数据表的默认格式,存储方式:行存储。 可使用Gzip,Bzip2等压缩算法压缩,压缩后的文件不支持split 但在反序列化过程中,必须逐个字符判断是不是分隔符和行结束符,因此反序列化开销会比SequenceFile高几十倍。 复制代码 –创建数据表: create table if not exists textfile_table( site string,原创 2017-10-26 09:37:05 · 367 阅读 · 0 评论