创新谈-班成英

创新性应用:
数据库应用从最早的管理信息系统(MIS)到后来专业的某一方面应用如ERP、CRM等的发展历程,从中可以看出数据库应用正在从面向管理走向辅助分析决策。人们逐渐希望数据库不仅仅是井井有条、条条有理的管理好自己的产品对象,更希望数据库的应用能够提高自己的决策能力。比如:超市管理人员不仅仅希望能够从数据库中快速的找到所要产品的存放位置,更希望能够从数据库中得到什么样的产品跟什么样的产品邦定在一块更能促进销售。这就是基于数据库上进行数据挖掘,这样便可以达到面向分析的数据库应用的目的。
数据仓库和数据挖掘并不是跟数据库隔离开来的两个应用,实质上,不管在技术上还是在应用上两者都是分不开的。举个简单的例子,就是数据库中实体关系图(ER图)跟数据仓库中星形、雪花形结构是一脉相承的。我在发表的《基于分析模式的数据库信息系统设计》一文中也主要提到了这样的观点。并在呼叫中心应用软件系统中,应用到这些观点。
随着呼叫中心(Call center)业务的发展,呼叫中心积累了大量的客户呼叫数据,如何利用客户呼叫的特征数据和行为数据,获得客户呼叫的行为模式,从而更好地为客户服务,为CRM等后续系统提供正确的依据,是呼叫中心需要迫切解决的问题。当前的呼叫中心分析软件大多采用传统的数据库统计分析技术,这些技术是验证型的技术,难以获得隐藏在数据背后的知识。而数据挖掘技术正是针对这些问题提出的,它是从大量的数据中,抽取出潜在的、有价值的知识、模型或规则,是属于发现型的技术。随着基于数据仓库、数据挖掘等数据分析综合性技术和解决方案的发展,数据挖掘、数据仓库成为数据库市场的新一轮增长点、成为下一代应用系统的重要组成部分;同时,数据仓库、数据挖掘技术的应用将会成为呼叫中心分析软件发展的必然趋势。
行业借鉴经验:
在呼叫中心(Call center)的客户信息分析方面我对现有数据库应用了数据仓库和数据挖掘技术进行了有益的探索,设计并实现了一个基于数据仓库和数据挖掘技术的呼叫中心信息分析平台DWMCA(Data Warehouse and Mining for Callcenter Analysis)。下面从体系结构、功能模块、关键技术等方面对DWMCA 进行了详细的介绍,特别重点介绍运用数据挖掘技术创建的功能模型。
体系机构总体上采用分布式的思想,包括数据层和应用层。处理过程上分为数据准备阶段、系统核心阶段和客户端显示阶段。
数据准备阶段:即ETL(Extract,transformate and load)阶段,主要包括清洗脏数据、析取转换转载等工作,负责将呼叫中心业务操作数据转换成呼叫中心系统数据仓库所需要的数据形式,也即创建数据仓库。
系统核心阶段:包括数据仓库、数据挖掘算法和挖掘结果模型库,完成基于数据仓库、选择数据挖掘算法、创建呼叫中心需求模型的功能,并对这些创建的模型进行管理。
客户端显示阶段:包括Web服务和客户端的显示,客户端向创建好的以WEB服务形式提供的功能模型请求,最后以用户易理解的可视化方式显示出,以使用户能够客观的了解呼叫中心业务分析模型的内容。
模型包括:呼叫初始转接评定模型、客户实时特征评估模型、客户利润分析模型、客户类别分析模型、客户群呼叫行为分析模型和客户呼叫异常行为分析模型等。
呼叫初始转接评定模型:客户初始转接评定就是当一个客户的呼叫到来的时候,通过客户填写的基本信息,系统给出一个建议的初始转接去向,也即一个呼叫可能的路由走向。该模型采用聚类技术原理,以客户的呼入数据为输入,表现为客户的初始转接方向分布特征。同时采用分类算法建立模型,来预测新客户的走向。
客户实时特征评估模型:客户的特征分类是一个动态变化的过程,根据客户呼叫行为的变化,特征应该相应的发生变化。系统可以采用神经元分类算法,根据客户的特征数据(客户基本信息)与客户的呼叫记录数据以及一些有意义的汇总数据,构建动态的信用等级模型。该模型能够让用户了解客户当前特征的分布情况,并可用预测算法预测下一阶段(如:月)客户的呼叫变化趋势。
客户利润分析模型:该模型分析客户呼叫所带来的消费情况的利润分布情况,对数据采用数据挖掘聚集原理,得到带来不同利润的客户的具体特征。系统将客户利润可以分为三种类型:高、中、低。用户可以对高、中、低的具体利润参数情况进行设置。
客户类别分析模型:当前的市场营销中很重要的一个特点是强调客户细分。客户类别分析的功能也在于此,系统采用数据挖掘中的分类技术,将客户分成四个重要的类别:呼叫频繁的客户、偶然大量呼叫的客户、稳定呼叫的客户、其他,帮助呼叫中心寻找出这些不同种类客户之间的特征。该模型可以让用户了解不同行为类别客户的分布特征,利用关联规则能够预测下一阶段客户的类别变化趋势。
客户群呼叫行为分析模型:每个客户都有一定的呼叫习惯,具有相似呼叫习惯的客户可以组成一个群体。通过分析一个个群体的呼叫特征,可以了解不同呼叫群体的呼叫模式,从而可以提供更贴切的绑订服务。客户消费行为分析模型利用聚集算法和关联规则,将客户消费行为数据划分为不同的聚集,在同一聚集内部的客户具有相同的消费行为,不同聚集之间的客户消费行为差异较大,对不同聚集的客户可以采取不同的服务应答策略。
客户呼叫异常行为分析模型:大多数人的呼叫行为称为“正常呼叫行为”,而在生活中往往还存在呼叫习惯和行为“与众不同”的人。客户呼叫异常行为分析模型可以找出这些有“异常呼叫行为”的人,提示呼叫中心给予充分的关注和警觉。异常是客户中心定义的,可以是与本身的异常,也可以是与别人的异常。该模型采用异常检测算法或时间序列算法,为每一条包括消费数据的客户记录计算一个异常因子,系统给出相应的异常呼叫曲线图,辅助银行了解异常的原因。
总之,由于对呼叫中心行业还算熟悉,而数据库的未来发展,随着海量数据的产生,也一定服务于数据仓库和数据挖掘,所以我提出了一个基于数据仓库和数据挖掘技术的呼叫中心数据分析系统的构建和设计,并初步提出了其结构机制,模型构造和应用算法,将数据挖掘技术与该应用领域进行了结合。一些地方虽然还有待于进一步完善和论证,同时数据仓库、数据挖掘等技术的具体实现方面还存在着一些难点,如在对有效数据的采集挖掘过程中,由于实际应用数据的复杂性,要涉及很多的数据挖掘算法,但数据挖掘技术在通信领域所产生的海量数据情况下有广阔的应用前景,基于数据挖掘技术的呼叫中心数据分析系统将会是未来该领域信息系统的发展方向,从而实现从大量的数据中按照各种不同的规则和数据模型,确定出真正有用的知识信息。

应用难点技巧:
举一简单例子。对于一条描述呼叫的记录,有StartTime(开始时间)、EndTime(结束时间)和AgentID(接听电话的分机字段),如何获得同时占(使)用AgentID(坐席号)的不同个分机记录的时间呢?如:同时有1个、2个、3个和4个分机接电话的时间数分别是多少。
受脉冲波的影响,将每条记录分成两条记录,分别表示开始时间和结束时间的记录(用一标识字段标识出来),也即一个脉冲的上升点和下降点,这个脉冲的延续时间就是该通话的延续时间。将上述拆分的记录按时间排序后,对标识字段循环判断,每遇一个开始时间记录,计数器加1;每遇一个结束时间记录,计数器减1;计数器不同记录个数所持续的时间,便是不同数目的分机同时通话的时间数。 

 
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值