笔记
soy啊
菜鸟上场~无可抵挡
展开
-
数据治理复盘
**数据治理哪些问题:**一般分类为格式问题,缺失问题,数据重复,逻辑问题,关联性验证问题以银行数据仓库来举例,复盘数据整个生命周期的治理数据生命周期:指数据录入采集到数据的应用消亡数据仓库的架构:源系统 --> ODS --> 数据仓库(主题层,共性加工层)–> 集市源系统 --> ODS:数据抽取,清洗,加载的过程。数据来源可以是直接从数据库抽取,文本文件,excel文件等,不同来源的数据文件需要进行清洗转换后才可以存储到数据仓库中。数据清洗的过程中就会碰到很多杂七原创 2021-02-26 10:27:35 · 239 阅读 · 2 评论 -
2021-02-01【典型】连续多天交易的客户
【典型】连续多天交易的客户lead() over()datediff() over()datestampdiff() over()连续两天(简单):1、表自关联,取datediff(date1,date2) =1 (最笨的办法)2、想找连续t天的交易,用lead() over() 取t-1的的交易日期,用第t-1天日期减去 第一天的日期 得出的时间差 等于 t 则就是想要的结果参考:https://blog.csdn.net/weixin_33198642/art..转载 2021-02-01 22:18:44 · 320 阅读 · 0 评论 -
2021-02-25 银行业十大主题记忆
银行业十大主题记忆机构 资产 财产 产品 营销 渠道 产品 当事人 协议 事件便于记忆:银行是一个企业,同时也是一个机构,涉及企业机构就会有资产,财务的存在,银行有自己的产品(信用卡,黄金,期货等)有产品就需要有人进行买卖,买卖的人这就是当事人,进行的买卖就是销售,有销售就得有渠道(不管是线上还是线下),在进行买卖,存贷款的时候需要签合同,这就是协议,整体这个交易就是事件,从而对银行的财务,资产产生影响。...原创 2021-02-25 18:14:16 · 3289 阅读 · 3 评论