自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(3)
  • 收藏
  • 关注

原创 数据治理复盘

**数据治理哪些问题:**一般分类为格式问题,缺失问题,数据重复,逻辑问题,关联性验证问题以银行数据仓库来举例,复盘数据整个生命周期的治理数据生命周期:指数据录入采集到数据的应用消亡数据仓库的架构:源系统 --> ODS --> 数据仓库(主题层,共性加工层)–> 集市源系统 --> ODS:数据抽取,清洗,加载的过程。数据来源可以是直接从数据库抽取,文本文件,excel文件等,不同来源的数据文件需要进行清洗转换后才可以存储到数据仓库中。数据清洗的过程中就会碰到很多杂七

2021-02-26 10:27:35 230 2

原创 2021-02-25 银行业十大主题记忆

银行业十大主题记忆机构 资产 财产 产品 营销 渠道 产品 当事人 协议 事件便于记忆:银行是一个企业,同时也是一个机构,涉及企业机构就会有资产,财务的存在,银行有自己的产品(信用卡,黄金,期货等)有产品就需要有人进行买卖,买卖的人这就是当事人,进行的买卖就是销售,有销售就得有渠道(不管是线上还是线下),在进行买卖,存贷款的时候需要签合同,这就是协议,整体这个交易就是事件,从而对银行的财务,资产产生影响。...

2021-02-25 18:14:16 3262 3

转载 2021-02-01【典型】连续多天交易的客户

【典型】连续多天交易的客户lead() over()datediff() over()datestampdiff() over()连续两天(简单):1、表自关联,取datediff(date1,date2) =1 (最笨的办法)2、想找连续t天的交易,用lead() over() 取t-1的的交易日期,用第t-1天日期减去 第一天的日期 得出的时间差 等于 t 则就是想要的结果参考:https://blog.csdn.net/weixin_33198642/art..

2021-02-01 22:18:44 310

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除