自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

BabyFish13

技术、业务、生活、人生......

  • 博客(2)
  • 资源 (6)
  • 收藏
  • 关注

原创 Hive整表数据分成256分表样式导出

不是由于mysql数据装载的需要,这样做实在太费时费力;即使用上32个并行,10来分钟就可以整场导出的表,要耗时1个半小时。/Users/nisj/PycharmProjects/BiDataProc/love/userLevel/HiveRunData-yicheng.py # -*- coding=utf-8 -*- import os import time import datetim...

2018-08-08 16:43:19 1127

原创 关于目前某游戏直播平台数仓建设规划的思考

大数据平台etl:sqoop、dataX,及airflow;python串联sql。 sqoop、dataX进行数据的抽取及传送;airflow进行调度;用python进行封装和编码。 游戏直播公司的数据仓库分层设计: 贴源设计的ODS层;主题设计的数据整合层;按需维度设计的集市层。 贴源ODS层数据分为两大类,一类是来源于业务系统数据库、一类是来源于日志,包括系统access log日志及因业...

2018-08-02 19:38:43 1039

有赞数据仓库元数据系统的演进(有赞Data沙龙).pdf

有赞数据仓库元数据系统的演进

2021-01-18

DM数据仓库建模

数据仓库建模的有关说明 详细的文档及解读的ppt

2019-03-22

NCR逻辑模型设计概览

逻辑模型设计 方法论;一些数据仓库建模时的参考,方法等。主要用在数据仓库体系规划、架构设计方面的参考。

2018-01-31

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除