- 博客(3)
- 收藏
- 关注
原创 【无标题】
**调度工具**: uc4 **代码提交:** github 维护代码更跌 **代码上线工具**:dalm,dalmneo 开发工具: VS JupyterLab 可以实时的连接数据源非常好用 etl规范(主要针对ods,如果是dim/fact则直接是表直接的操作) teradata:source抽取-> 平面文件 -> stg表-> merge 到ods表 hive: soucre ->rds ->stg->ods gcp : source ->rds ->
2022-04-09 11:22:16 1569
原创 ETL过程中的E-Extrcact
数据来源: dropzone文件 三方api服务(resultful风格) hive集群的数据湖 业务增量库(oracle) 3.1与source保持完全一致的副本库 3.2保存7天的历史的存量库 etc 数据抽取工具: 1.informatica (暂不展开) 2.linux shell 本质上都是sql 的抽取 数据抽取过程 extract sql --oracle SELECT case_tid --pk1 ,redress_seq --pk2 ,redress_type ,redres
2022-03-28 21:14:50 646
原创 牛客网音短视频类sql-4
牛客网-- 面试某音短视频 SQL 4 每个创作者每月的涨粉率及截止当前的总粉丝量 问题:计算2021年里每个创作者每月的涨粉率及截止当月的总粉丝量 注:涨粉率=(加粉量 - 掉粉量) / 播放量。结果按创作者ID、总粉丝量升序排序。 if_follow-是否关注为1表示用户观看视频中关注了视频创作者,为0表示此次互动前后关注状态未发生变化,为2表示本次观看过程中取消了关注。 分析: 1.if_if_follow 的0,1,2分别代表不同情况,用case when 区分一下 ,并按照author,month
2022-03-21 22:04:31 280
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人