自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

BabyFish13

技术、业务、生活、人生......

  • 博客(4)
  • 资源 (6)
  • 收藏
  • 关注

原创 hive动态分区使用(如非必须,不建议使用)

往hive分区表中插入数据时,如果需要创建的分区很多,比如以表中某个字段进行分区存储,则需要复制粘贴修改很多sql去执行,效率低。hive提供了一个动态分区功能,其可以基于查询参数的位置去推断分区的名称,从而建立分区。一、单一分区字段动态分区表的创建与数据插入1、建表drop table if exists tmp.tmp_user_push_dynamic_partition;C...

2019-10-16 18:52:51 3021

原创 Hive切换计算引擎

1、默认计算引擎mrset hive.execution.engine=mr;2、spark计算引擎set hive.execution.engine=spark;set spark.executor.cores=2;set spark.executor.memory=10G;set spark.executor.instances=10;set hive.mapred.m...

2019-10-16 13:23:02 3694

原创 Hive的数据存储格式

Hive支持的存储格式有: Text File SequenceFile RCFile Avro Files ORC Files Parquet注:Hive默认的格式为Text File,可以通过set hive.default.fileformat查看。hive支持在创建表的时候对数据进行压缩,配置如下:设置开启压缩:set hive.exec...

2019-10-10 17:53:04 710

原创 Hadoop集群间distcp数据同步小记

1、本地hdfs文件查看hadoop dfs -ls /usr/hive/warehouse/dwf.db/dwf_user_kuanbiao_full_1d/dt=2019-09-21hadoop dfs -ls /usr/hive/warehouse/dwf.db/hadoop dfs -ls /usr/hive/warehouse/dwf.db/dwf_user_kuanbiao_...

2019-10-08 10:56:06 1508

有赞数据仓库元数据系统的演进(有赞Data沙龙).pdf

有赞数据仓库元数据系统的演进

2021-01-18

DM数据仓库建模

数据仓库建模的有关说明 详细的文档及解读的ppt

2019-03-22

NCR逻辑模型设计概览

逻辑模型设计 方法论;一些数据仓库建模时的参考,方法等。主要用在数据仓库体系规划、架构设计方面的参考。

2018-01-31

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除