004-银行数据主题划分

前言

  • 随着数据仓库中的表(模型)越来越多,我们需要考虑怎么管理这些模型,以更好的记住自己有哪些数据,从而当业务提出需求时,可以快速的知道自己是否能够支撑需求,以及定位到使用哪个模型去支持。
  • 比如,当业务提出需求,希望知道有多少客户,有多少人签约了支付宝,客户总共有多少资产,近一个月内访问过支付宝的客户有多少人时,只需要:count(客户号)可知有多少客户,sum(case when 签约支付宝=1 then 1 else 0 end)可求有多少人签约支付宝,sum(资产)可知总资产,sum(case when 近一个月访问支付宝=1 then 1 else 0 end)可知有多少人访问支付宝。
  • 在这个需求中,我们可以拆解出 “客户号、签约支付宝、资产、近一个月是否访问支付宝”4个明细字段字段。现在的问题是,假设我们已经有5个模型,这5个模型共计100个字段,那么上述的4个字段,是如何分配在这5个模型中的?是都集中在a模型中,还是分别处于abcd四个模型中。如果现在没有“近一个月是否访问支付宝”字段,需要新增,那我们是将其归入到已有的某个模型中,还是需要新建模型f ?背后的依据是什么。

正文

1 TeraData金融数据模型

Teradata FS-LDM金融数据模型是一个成熟的产品,包含十大主题:当事人、协议、产品、资产、事件、活动、地域、内部机构、渠道、财务。
网上关于Teradata FS-LDM的文章已经有很多,正如介绍所说,其是一个非常成熟的产品,在概念上更抽象、总览。若谈论到金融数据模型,不提及Teradata FS-LDM总归不太合适,但若以次作为理论并举例说明,就不是一两句话能讲完的了。因此,本文提及Teradata FS-LDM仅作为文章内容的完整性,对此关注的朋友,可自行前往其他链接查看,本文仅做简单理论介绍。
在这里插入图片描述

2 以客户为中心的-金融数据模型

设计数据模型时,要考虑主要问题有:1主题;2主键;3存储策略;4生命周期。在本文中,暂讨论以客户为中心的数据模型划分,即以客户号为主键。存储策略和生命周期,对主题划分影响不大,因此暂忽略不计。
在支撑业务人员的数据需求工作中,业务人员所需要字段经过维度变化,很容易变的繁多,为了便于数据核对、提高数据准确性,降低重复加工,提高开发效率,有必要对业务需求进行拆解,分析出底层明细字段,建立项目组自己的客户级明细字段模型。建立明细字段模型时,即需要考虑主题划分,根据主题,对字段进行归纳分类。划分主题需要考虑的目标有:1面对每次数据需求,尽可能总能通过固定的几个明细模型表中取得,以减少工作量。2: 口径一致、可解释,以提高数据质量
借鉴TeraData金融数据模型,划分出的主题可以是
在这里插入图片描述
主题划分说明:

  • asse资产:资产是由过去的交易或事项形成的,客户现在所拥有的资金,是时点数据
  • deal交易:交易对是一段时间内的交易记录,是时期数据
  • visit访问:访问是对一段时间内的浏览、访问等行为轨迹的记录,是时期数据
  • market营销:营销是对客户的营销活动记录,主要是时期数据
  • basc基本:若一个指标,感觉放在资产、交易、访问、营销都不合适,那就放入基本信息。随着基本信息的内容越来越多,可以考虑将其中的一部分字段摘出,单独归纳为表,比如归纳出‘标签’或‘签约’主题
    客户的定期余额多少,属于资产类;客户首次购买定期产品时间、本年购买理财产品次数,属于交易类;

结语

理解数据仓库的主题分类,可以帮助我们更好的记忆、管理自己的表单

在整理自己部门的表单时,根据实际情况,可以划分出更符合自己所使用的数据类型的主题,如单独划分出“参数”类主题


读者若有疑问或感觉不妥之处,欢迎沟通交流: xiaojian625800335

欢迎转载,转载请注明出处。

  • 1
    点赞
  • 15
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值