客户分析系统

银行高端客户识别与流失分析系统

一.项目背景
二.系统开发及实现
三.系统的具体性能演示
四.系统前景及经济效益

五.作品简介

六.作品思路

七.相关表数据

八.作品创新点

 

 

一.项目背景

二八定律给一个公司带来80%利润的是20%的客户

营销学规律吸引一个新顾客的成本是维系一个老顾客的成本的五倍

随着中国经济的不断发展,人民生活水平迅速提高,储蓄总量以及对投资的需求不断上升,这种需求的增长对银行业来说是一个巨大的发展机会。但同时,由于与国际的接轨,世界各大金融机构纷纷进驻中国,金融业务的竞争也是不断加剧。在这种竞争激烈,客户需求个性化,产品和服务差异越来越小的环境下,商业银行只有抓住了客户的需求,与客户建立良好的关系,才能在竞争中取得大的发展。根据二八定律,商业银行百分之八十的利润是由百分之二十的客户所创造的。商业银行只有设法识别和维护那些对银行利润最大的客户,防止优质客户的流失,才能以有限的资源得到最大的收益,才能在激烈的竞争中得到立足之地,获得资本最大化。因此,构建基于信息化技术的商业银行高端客户关系管理系统是提高银行核心竞争力的关键之一。

     目前,大多数银行在对客户价值评估和贡献度分析方面和贡献度以及忠诚度等分析方面,特别是高端客户的识别,往往还停留在手工和非标准,非量化的阶段,识别手段单一,准确度差。而客户关系管理也停留在手工帐台阶段,成本高,产出低。对于客户的维护也常常缺乏必要的手段,对客户的流失常常无法作出应有的营销方案,使得优质客户流失,对银行的利润造成很大损失。当然也有部分银行开发了简单的信息系统,通过批量导入或手工录入的方式建立企业客户信息数据库,并由专人定期维护数据库。这些系统,在一定程度上实现了对个人金融客户的资料维护,信息查询,贡献度分析等,分析手段比较单一,客户价值模型过于简单,导致了核心客户的识别准确度较低。这些系统功能集中在客户信息查询方面,而进一步深层次的分析处理相对较弱,对于业务的支持效果也就比较差了。

     我们项目组开发的银行高端客户识别与流失分析系统。核心部分就是通过对存量和增量数据的挖掘,建立了一个巨有较高可操作性和可靠性、高扩展性、高兼容性和高辨识度的高端客户识别模型。在流失方面也通过数据挖掘技术,实现了对数据仓库中数据的挖掘,着眼于高端客户的精细化营销,利用新科技手段进行数据挖掘,针对客户流失这个主题,通过客户细分的方式,将可能流失的客户识别出来,用营销手段以及提出有针对性的理财产品计划,维护客户关系,减少客户的流失并使得银行能获得更大利润。

 

二.系统开发及实现

客户流失预测:

2.1.1  银行客户流失定义:

客户流失是指客户由于某些原因而停止服务,离开企业而投向别的竞争对手,对于银行企业来说,最直接的一种流失现象就是客户提出注销帐户的请求,然而,在某些时候,客户也可能会取出帐户中的所有余额而不注销帐户,这同样也导致流失.在这里,我们研究的对象是那些具有流失倾向,且在未来一段时间内极有可能出现流失的那部分群体客户.

2.1.2   客户流失标准:

结合银行自身的特点,我们定义银行客户流失的标准如下:当某个客户在连续的三个季度中,在银行的日平均存款余额低于某个水平,且帐户的余额呈现出下降趋势,或者在银行的帐户余额长期呈现出0的现象,则我们认为该客户可能会流失或者已经流失.

2.1.3   数据挖掘之前的准备工作:

在进行数据挖掘任务之前,我们需要先对数据源的数据进行抽取,清理,装载,刷新并放入到数据仓库中,图示如下:

在对数据源中提取的数据进行清理时,我们需要删除一些无效的数据,对于某些重要的缺失的数据,我们还需要进行填充,在把数据集装载到数据仓库中之前,我们需要对这些数据进行处理,从已有的数据集中提炼出对我们有效的数据,如提取出每个客户的日平均存款余额,存贷总额等,最终把这些数据放入到数据仓库中,以便以后的数据挖掘算法进行数据提取.

2. 1.4   挖掘模型简介:

这里,对于客户流失问题,我们采取的挖掘模型是Logistic 回归模型.该回归模型能够分析二分类与解释变量之间的关系,使用自变量(即模型输入变量)去预测因变量在给定的某个值(流失或非流失)的概率.在 Logistic Curve 中有一个临界递增 S 型函数,适用于分析一些几率模型,而根据分类性变数,产生输出变数,其值可为,常代表选择量度中的是与否两类

由于我们需要预测每个客户是否可能流失的状态,而概率的大小最终可以决定流失的可能性,所以我们需要知道每个客户流失的概率p,而这些概率的大小可能会与很多因素相关联,这已经不是简单的线性关系所能够解释的了,另外,当不同的客户资料发生很大的变化时,流失的概率p只能在[0,1]上浮动,这将导致数值的可靠度下划,准确率降低.

假设客户流失的概率为p,我们设函数f(p)=ln(p/1-p),f(p)的范围变为[_∞,+∞],且有p=ef(p)/(1+ ef(p)),这样就扩大了其数值范围,同时使p成为关于ef(p)的一个反比例函数.按照这种思路,F(x)={1+exp{-(x-u)/o}}-1 ,其中, _∞<u<+∞,o>0的分布就称为是Logistic分布.

2. 1.5  挖掘工具的选择:

利用SQL Server 2005 Analysis Services作为数据分析软件,该软件提供了DMX挖掘语言来定义结构,添加模型和处理模型,并且挖掘的结果能够通过通过Reporting Services 软件来实现报表服务,可以直接通过报表的方式将结果呈现出来.

2. 1.6   挖掘模型变量选取:

1).输入变量选取:输入变量的数据都是由数据库中提取并清理之后的数据记录,它包括静态数据和动态数据,该模型中,输入变量有:客户出生年月,婚姻状况,民族,所在地,文化程度,性别,月收入,政治面貌,职业,在银行办理的总业务数目,持信用卡总数目,定期存折总额,定活两便业务总额,国债购买总额,活期存折总额,连续三季度日平均存款总额,连续三季度日平均网银总额,连续三季度消费总额变化,所有信用卡帐户总余额等,在选取输入变量之前,对这些变量进行关联分析,对于那些关联程度比较大的组数据,我们需要对其进行删除.输入变量的选取对于模型的建立和结果的预测都至关重要,在该模型中,我们从客户的固有因素,时间因素,交易频度因素,帐户余额及数目变化因素来决定模型的输入变量.

2).输出变量选取:对于该模型,输出变量即为客户的状态(流失或者不流失).

2. 1.7   模型建立:

提取的数据都保存在数据仓库中,从数据仓库中提取数据,并使用还没有被确认为流失的那部分群体来进行建模.使用DMX语言创建挖掘结构

2.1.8  模型分析图解:

根据已有的结构和创建好的模型,以数据仓库中提取的数据作为分析对象,分析结果如下图:

 

2.1.9 提升图与利润图:

2.1.10   模型分析结果:

模型分析结果将通过报表在网页上显示.

.高端客户识别:

2.2.1  由于系统数据容易受到一些错误输入数据,空缺数据和不一致数据的干扰,于是我们同样需要利用回归或判定树的方法来推测那些可能的缺失值,对于噪声数据,采用分箱,聚类等方法来消除,如下图:

2.2.2中高端客户识别模型的一个子模型是客户重要度分析模型,这里我们引用RFM方法作为客户重要度的分析方法,其基本思想是通过三个重要的客户行为指标来判断客户的重要度,R表示客户最近一次交易的时间距离现在的天数,F表示客户在最近一段时间内交易的次数,M表示客户在最近一段时间内的交易金额,根据这些变量对银行效益值的影响,可以推导出表达式(1/R)*F*M*T,T指客户在银行办理的业务总数,R的值越小,重要度系数越大,FM的值越大,重要度系数越大.

2.2.3中高端客户识别系统的另一个子模型是客户价值度分析模型. 当我们从更完整的会计核算角度来评估为客户花费的成本的时候,客户价值就不仅仅是销售额减去产品成本这么简单的一组表达式所能表达的了。我们还需要考虑为客户花费的一对一的销售费用、服务费用,考虑营销费用的分摊,甚至还要考虑与销售、服务和营销售直接相关的管理费用分摊。分别计算客户的现有价值={客户的日平均存款余额*[一年期贷款利率*(1-银行存款准备金比率-备付金比率)+准备金存款利率*(银行准备金比率+备付金比率)+准备金存款利率]-日均存款总额*平均存款利率}*存款稳定调整系数*综合调整系数+[日平均贷款余额*贷款利率*(1-税率)-贷款余额*平均存款利率]*效益系数计算客户的潜在价值=(95%置信区间高点-日平均总额)/标准偏差*天数/目前帐户总额.客户的价值度=现有价值+潜在价值.

2.2.4中高端客户识别系统的另一个子模型是客户忠诚度分析模型.一般而言,忠诚度高的客户往往对银行产品或者银行服务表现出特殊的青睐,一段时间内重复进行某一活动,使用率比较高,对于产品或者服务进行再次购买决策时,选择产品或服务时间比较短.由于各种复杂因素对忠诚度的分析有着不同的影响,因此,将这些因素之间的关系加以条理化,并以此为依据推算出个因素对忠诚度的权值大小,为此采用AHP方法进行分析,根据层次分析要求,建立递阶层次结构模型如下图示:

 

 

 

 

 

式中, xi是因素层中因素Ci各种情况的实际值, xmax是最大值,忠诚度M=∑DCi*c.

2.2.5中高端客户识别功能支持模型参数的自由设置,实现各级机构对个人客户分析的个性化,它所需数据依靠其子模型价值度模型,重要度模型,忠诚度模型作为数据源提供端,通过对这三个子模型的参数设置来确定高端客户系数,具体图解如下:

 

 

: 以上数据都是通过设置代理进行定时处理,处理的结果被写回到数据库中保存,通过界面的查询功能可以直接实现即时的查找.能够快速准确的帮助决策者进行决策.

三.系统的具体性能演示

 

四.系统前景及经济效益

随着金融行业信息基础设施建设的不断完善,信息资源的开发越来越受到重视。金融企业已经开始应用信息技术对资金流、信息流、业务流进行全面的整合。金融行业已经经历了数据大集中时代的考验。为了解决金融业中数据越来越多这一新课题,顺应时代潮流,引进以数据挖掘为核心的的知识发现技术已经成为金融界的共识。数据挖掘技术在于帮助金融企业分析影响其业务的关键因素,挖掘诸如“哪类客户更适合营销某类金融产品,创造新客户的成本有多少,哪类客户将要流失”等方面的问题,从而帮助银行增加收入、降低成本、使银行业的管理决策更加科学,客户分析更加精确。

商业银行客户群规模的异常庞大使准确地进行市场细分和寻找有效高端客户变得异常困难,传统的目测观察识别和问询式手段都显得过于主观和不具有推广意义,同时还具有识别率低和识别成本高的缺点。在客户流失识别方面,传统的方案无法准确识别客户的流失,也不能归纳出客户流失的规律,从而也无法做到防范客户流失。客户的流失,特别是高端客户的流失对商业银行的利润带来了很大的损失。我们的银行高端客户识别与流失分析系统正是为了解决以上问题,高端客户识别系统将极大的提升银行个人客户的服务水平、加大对高端客户的金融产品交叉营销力度,提高高端客户在银行个人金融产品中的渗透率,进一步稳定高端客户方面发挥积极的作用。而高端客户流失分析体系则可以帮助银行预先发现流失可能高的高端客户,并在流失之前做好客户的挽留和个性化营销工作,达到减少客户流失,减少银行营销成本,增大银行利润的目的。

     相信在银行利用了数据挖掘技术识别高端客户以及防止高端客户流失系统后,一定能更加准确的识别并留住,从而使银行对客户的营销更有针对性。银行高端客户识别与流失分析系统在为银行创造效益的同时,消费者也通过银行更有针对性的服务获得了更加优质和个性化的服务,从而达到双赢的效果。

 

 五.作品简介

 

   核心部分就是通过对存量和增量数据的挖掘,建立了一个巨有较高可操作性和可靠性、高扩展性、高兼容性和高辨识度的高端客户识别模型。在流失方面也通过数据挖掘技术,实现了对数据仓库中数据的挖掘,着眼于高端客户的精细化营销,利用新科技手段进行数据挖掘,针对客户流失这个主题,通过客户细分的方式,将可能流失的客户识别出来,用营销手段以及提出有针对性的理财产品计划,维护客户关系,减少客户的流失并使得银行能获得更大利润。

 

六.作品思路

 

  

 

 

 

七.相关表数据

客户个人信息表、客户联系方式表、个人理财业务表、贷款业务表、储蓄业务表、储蓄交易表、代收付交易表、银行支行表、代收代付业务表、信用卡交易表、银行收支表、信用卡业务表、柜台业务表、网银交易表、网银业务表、管理员登录表、员工信息表等。

 

八.作品创新点

1、解决了银行识别高端客户手段单一的问题

2、解决了银行难以预防客户流失的问题

3、构建了新的识别及流失模型

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值