数据集市项目的总结

这篇博客回顾了一个耗时两年半、投资3000万的数据集市项目,涉及银行信用卡中心的数据集成与分析。文章详细介绍了项目从启动、需求收集到测试上线的过程,揭示了项目中的困难与挑战,包括需求不明确、沟通不畅、数据质量问题等。博主强调了项目管理、需求导向和数据质量的重要性,并从中提炼出宝贵的教训,旨在避免重复过去的错误。
摘要由CSDN通过智能技术生成

本人毕业就在某银行信用卡中心工作,做了数据集市项目,据说投资3000万。后来在阿里做数据产品经理的工作,想把过去的工作总结一下,不管成功和失败,都是一种经历。于是有了下面的文字。

<wbr></wbr>

【项目概况】

项目立项花费时间:1年多

项目启动时间:2009年3月21日

实施公司:东南融通-菲奈特

硬件:忘了

数据库:DB2

ETL调度:Datastage

Olap服务器:hyperion

需求方/业务处:市场、风险、财务;客服、直营、电营、网营、催收、客服;监控处、操作处

项目经理:总行科技部出1人

项目管理:卡中心系统处出1人

业务咨询:决策管理处-数据仓库组(5人)

源系统:semacard核心计费系统、财务系统、信审无纸化系统、催收系统、客服系统、短信平台

甲方更换的项目经理:3人

甲方参与人数:决策管理处10人,系统处2人,业务处的经办20人,由此而牵涉到的开发公司源讯(核心系统)、信雅达(信审无纸化)、广东电信(客服)、华为(客服)等等。

牵涉到的最高层:副行长

经常涉及到的高层:卡中心总经理、副总经理、各业务处总监和主管

开会的频率:每两周至少一次大会,每天至少一次小会

乙方更换的项目经理:3人

乙方投入的人力:至少是20-30人的人力,持续做了2.5年。

<wbr></wbr>

我于2010年12月离职,当时一期还没有测试完成,据了解到2011年10月份的时候,所有的需求全部上线。

<wbr></wbr>

下面一一介绍,如果马上要想到一个词:痛苦。

<wbr></wbr>

【项目启动】

首先谈项目启动。据说用了一年多的时间。当时,广发一直有SAS组(后改名为决策管理处),分3个小组,报表组、仓库组、模型组,报表组处理各业务处的日常数据需求,包括简单报表、复杂分析、周期任务,甚至包括很多线上项目,仓库组负责中间层的建设,数据字典的维护,以及想推动数据集市建立,而成立的。模型组主要是维护评分卡项目,以及各业务处在风险及营销方面的客户评分等需求。成员中计算机背景的比例偏低,更多的是业务方面和数学功底。

有一套cognos的报表系统,为财务、风险、市场等部门提供基本的在线查询报表服务。但统计口径陈旧,没有进行数据更新,数据质量较差。

从系统架构上来看,报表组和仓库组有一台采集服务器,一台分析服务器,2台工作站作为存储,其余所有临时任务都在开发人员本地进行。模型组相对独立,有一台专门跑批评分卡的服务器,其余模型分析工作在开发人员本地进行。

开发环境:windows

开发语言:SAS

调度系统:用windows的任务计划

总体来讲,IT化程度较低,大部分工作(如需求的记录、需求分配、需求审核、bug记录、调度系统、导出结果数据、甚至扣费等涉及到钱的关键步骤)都通过人工来维护。此模式已经运行了8年之久,虽然比较落后,但也形成了一定的规模,满足日常业务处的数据需求,没有遇到多大的瓶颈。

但也有很多困扰,例如:

1)存储少,很多是月存储,没有日快照存储,很多业务分析由于无法追溯历史而不能进行

2)计算速度慢,大部分是在本地进行,本地的工作站虽然配置比一般的pc好一些,但跑批上G甚至上10G时,基本无法完成。而且计算资源分散,容易导致计算和存储资源的浪费。

3)数据质量不高,经常听到取错数据的消息甚至是处罚。数据质量的保证通过,交叉review和业务人员随机抽查计算来完成,很多关键的业务数据(分期付款的返回、积分的返回等)都是通过SAS组计算完成,然后将结果传输到核心系统进行处理。

4)调度系统落后,很多依赖关系没有解决,很多是通过跑批时长来估算,确定任务的开始时间。

5)需求管理混乱,需求的质量无法把控

评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值