数据仓库技术在电信企业的应用

一、引言
随着电信企业经营环境的变化,市场竞争越来越激烈。如何有效地利用有利的工具提高经营决策水平,成为今天每个电信企业必须面对的问题。数据仓库就是一种提高企业业务分析能力和决策水平的有效工具。业务据调查,在许多引入竞争机制的国家或地区,如美国、英国,日本,电信公司都建立数据仓库系统作为经营决策的工具,提高客户满意度和经营利润。国外专业电信顾问公司研究调查发现,数据仓库和统计分析模型两项独特能力是竞争优势的来源,是当今电信公司成功的重要原因之一。
电信企业一直使用计算机处理各种业务,包括设备维护(网络系统)、业务管理(九七系统、财务系统)、财务管理等,具有丰富的历史数据,因此建立数据仓库有良好的基础。数据仓库的目的是要建立一种体系化的数据存贮环境,将分析决策所需的大量数据从传统的操作环境中分离出来,使分散的、不一致的操作数据转换成集成的、统一的信息,企业内不同单位的成员都可以在此单一的环境之下,通过运用其中的数据与信息,发现全新的视野和新的问题、新的分析与想法,进而发展出制度化的决策系统,并获取更多经营效益。

二、什么是数据仓库

什么是数据仓库?数据仓库概念创始人W.H.Inmon将其定义为:“数据仓库是支持管理决策过程的,面向主题的、集成的、稳定的、随时间变化的数据集合”。
它指出了数据仓库有以下几个特点:
1
、面向主题
主题是一个抽象的概念,是在较高层次上将企业信息系统中的数据综合、归类并进行分析利用的抽象。在逻辑意义上,它是对应企业中某一宏观分析领域所涉及的分析对象,是针对某一决策问题而设置的。面向主题的数据组织方式,就是在较高层次上对分析对象的数据的一个完整的、统一的、一致的描述,能完整、统一地刻画各个分析对象所涉及的企业的各项数据,以及数据之间的联系。

目前,数据仓库的实现主要是基于关系数据库,每个主题由一组关系表或逻辑视图实现。这些表和视图的内容与原来各个运行系统数据源的数据本质上是一致的,但为了方便支持分析数据处理,对数据结构进行了重组,其中还可能会增加一些数据冗余。

2
、集成的数据

数据仓库中存贮的数据是从原来分散的各个子系统中提取出来的,但并不是原有数据的简单拷贝,而是经过统一、综合。其一,数据仓库的数据不能直接从原有数据库系统中得到。原有数据库系统记录的是每一项业务处理的流水帐,这些数据不适合于分析处理,在进入数据仓库之前必须经过综合、计算,抛弃分析处理不需要的数据项,增加一些可能涉及的外部数据。其二,数据仓库每一个主题所对应的源数据在原分散数据库中有许多重复或不一致的地方,必须将这些数据转换成全局统一的定义,消除不一致和错误的地方,以保证数据的质量。否则,对不准确,甚至不正确的数据分析得出的结果将不能用于指导企业作出科学的决策。对源数据的集成是数据仓库建设中最关键,也是最复杂的一步。

3
、数据不可更新

从数据的使用方式上看,数据仓库的数据不可更新,这是指当数据被存放到数据仓库中以后,最终用户只能通过分析工具进行查询、分析,而不能修改其中存贮的数据,也就是说,数据仓库的数据对最终用户而言是只读的。由于数据仓库的查询数据量往往很大,所以对数据查询、查询界面的友好和数据的表示提出了很高提出了更高的要求,因为对数据仓库进行查询分析的用户多是企业的高层领导,他们是所在领域的专家,但对计算机却不一定熟悉。

从数据的内容上看,数据仓库存贮的是企业当前的和历史的数据,在一定的时间间隔以后,当前的数据需要按一定的方法转换成历史数据,年代久远的、查询率低的数据的需要从数据仓库脱离到廉价慢速设备(如磁带)上,对分析处理不再有用的数据需要从数据仓库中删除。但这些工作是由系统管理员来做,或由系统自动完成。因此,也可以说数据仓库在一定时间间隔内是稳定的。

4
、数据随时间不断变化

数据仓库数据的不可更新是针对应用而言,即用户进行分析处理时不对数据进行更新操作,但不是说,数据从进入数据仓库以后就永远不变。数据仓库中的数据随时间变化而定期地被更新,每隔一段固定的时间间隔后,运作数据库系统中产生的数据被抽取、转换以后集成到数据仓库中,而数据的过去版本仍被保留在数据仓库中,如同"定期摄影术",每隔一周、一月或适当的间隔就照一张像;随着时间的变化,数据以更高的综合层次被不断综合,以适应趋势分析的要求;当数据超过数据仓库的存储期限,或对分析不在有用时,这些数据将从数据仓库中删去。

关于数据仓库的结构信息、维护信息被保存在数据仓库的元数据中,数据仓库维护工作由系统根据元数据中的定义自动进行,或由系统管理员定期维护,用户不必关心数据仓库如何被更新的细节。


三、数据仓库与传统数据库的区别

数据仓库与传统的数据库系统相比有着本质的区别。它们的区别主要表现在
1
、建立方式不同
数据库是一种通用平台,建立于严格的数学模型之上,用来管理企业数据,进行事务处理,完成相关业务。目前电信企业普遍采用的ORACLESYBASE等数据库产品都是大型的关系型数据库管理系统,它们的数据严格按照关系模型的规则组织。而数据仓库没有严格的数据理论,更偏向于工程,它不是花钱就可购买到的成品,而是企业一个日积月累的建立过程。一般现在的数据仓库系统其数据源都来自企业的数据库系统,经过一定的清洗、转换、汇总、格式化后加入到数据仓库中。因此数据仓库是更高一个层次上的数据系统。

2
、包含数据不同
数据库系统包含的数据都是操作型数据,有时又称为OLTP(联机事务处理)数据、原始数据、初始数据和联机数据;而数据仓库系统包含的是分析型数据,有时也称为信息性数据、决策支持数据、导出数据、提取数据和总结数据。

这两种数据在使用方面有着显著区别:

操作型数据表示业务处理的动态情况,数据在存取的瞬间是正确的而分析型数据表示业务处理的静态情况,代表过去的数据。

操作型数据可由操作人员通过应用软件更新,而分析型数据一般不可更新,终端用户的访问权限常常是只读的。

操作型数据处理细节问题,它有许多事务,每个事务影响数据的一小部分,而分析型数据更多关注的是结论性的数据,是综合的,或是提炼的。它有数目不多的一些查询,但每个查询可访问大量的数据。

操作型数据操作需求事先可知道,系统可按预计的工作量进行优化,而分析型数据操作需求事先不知道,系统不能确定下一步用户要做什么。

操作型数据有许多事务,每个事务影响数据的一小部分操作型数据对性能要求高,而分析型数据对性能要求宽松

因此这两种数据不应该保存在一起。一个好的操作型数据库不能很好地支持分析决策,一个好的分析型数据库也不能高效地为业务处理服务,因此,应将它们分开,分别组织起操作数据环境和分析数据环境。

3
、应用对象层次不同

数据库系统面向应用,支持日常操作,使用者主要是企业的业务操作人员,用户不必理解数据库,他们只是输入数据或按照设定好它的业务逻辑对数据进行变动。而数据仓库系统面向分析,支持管理需求。使用者是企业的业务管理者和经营决策人员,用户需要理解数据仓库的组织结构,从而更好地发掘有价值的信息。

4
、支撑的应用不同

数据库支持的应用主要是联机事务处理(OLTP),即可能大量发生,又要求快速响应的事件。如本地网计费的销帐系统,97的业务受理系统,民航的定票系统等。数据仓库主要为联机分析处理(OLAP)和数据挖掘(Datamining)等技术的实现提供基础,进而帮助企业实现决策支持系统(DSS)和客户关系管理系统(CRM)。


四、数据仓库是CRM的基础

  长期以来,在电信业务的经营过程中,我国电信企业一直遵循“用心服务,用户至上”的宗旨。然而由于没有竞争,电信企业“以客户为中心”的经营原则并没有真正发挥作用,电信企业为客户提供均一化的业务,并不考虑单群或单个客户的特别需要,因为市场上没有其它的电信运营商提供更接近这些用户群的业务。

  电信市场放开和竞争加剧的趋势,对电信企业的竞争能力提出更高要求。电信企业一般从三个方面区别于竞争对手并获得竞争优势:价格、业务和客户服务。价格战不能长期使用,业务质量的差异性也随着技术的发展将逐步消失,因此,完善客户服务成为电信企业获取最终竞争优势的重要手段。

  目前,我国电信增值业务市场已经全部放开,长话业务市场也正逐步放开,竞争的帷幕刚刚拉开。中国电信已经深深感到了竞争的压力,由于政府对主导电信企业的非对称管制,价格并不能成为中国电信竞争工具,并且由于技术的发展,业务质量也不能成为市场新进入者们的竞争障碍。在电信行业内,赢得一个新客户比保留一个老客户所付出的代价要高得多,因此,提高服务质量,赢得客户的忠诚对企业生存发展意义重大。另一方面,市场放开,客户的选择多了,以前的“自然忠诚”有了显著的变化,客户对市场认识越深,越希望作为一个独立的个体被认识和理解,越希望企业更好地理解和满足他们的需求,为它们提供个性化的服务。因此,以客户为导向,建立客户营销体系,减少客户的流失,提高客户的忠诚度,成为中国电信在竞争中处于有利地位的重要手段。

但是电信的客户群体非常庞大,而且客户对服务的要求也越来越高,作好服务工作不再是漂亮的营业员会微笑就可以完成的事了,必须有专门的系统对用户进行客户关系管理分析,也就是CRMCustomer Relation Manage)。具体内容包括:利用用户资料和一切可能有助于进行客户分析管理的资料进行客户概况分析,客户忠诚度分析,客户利润分析 ,客户性能分析,客户未来分析,客户产品分析,客户促销分析;通过对这些数据的分析,提供既能留住老客户又能吸引新客户的决策信息。
根据调查,实施CRM可以对企业带来三个方面的好处:收入的增加;生产力的提高;客户满意度的提高。同时,权威机构的研究也发现在国外实施CRM的企业当中:有三分之一的企业其客户关系管理都没有成功,取得实施前规划中的效益。为什么会有如此多的企业陷入这样困境?分析其原因发现,这些企业没有提供详细的交易数据。没有与客户互动的数据,因此没有办法做好客户关系管理。数据是做好客户关系管理的基础,处理大量的数据有要有一个数据仓库。
数据仓库可以将各个渠道得来的数据,整理成全面、完善的客户信息库。数据仓库内存储有详细的客户轮廓的信息和客户交易行为的历史数据,通过数据挖掘和数据分析,来发现隐藏在数据后面的真实情况,才能了解客户的需求,从而提高企业的收益率和竞争力。因此数据仓库就是CRM的大脑。

五、数据仓库在电信企业的其他应用

1
、话单分析

用户的通话话单包括了用户一次消费行为的所有信息。通过对大量历史话单的分析可以了解用户的消费习惯、消费能力等许多有价值的信息。然而,由于长话话单数量巨大,要在线保存需要占用大量的数据空间,一般电信企业只保留半年的在线话单。这给话单分析带来了麻烦,例如要比较去年五一节假期间与今年五一节假期间的长话变化情况就不太好办,而要比较最近五年的变化情况几乎就不可能。而且,保存的话单数据是为计费需要而设计的,不适应话单分析的要求,比如要统计超长话单和超短话单的地区分布情况和用户分布情况就不好办。直接在计费数据库中进行检索非常缓慢效果又不好,还可能影响正常的业务运行。
其实,一般进行分析、统计关心的是某一类用户的消费行为,而不会细到具体某个号码某次的通话记录。因此,可以事先设定一个粒度,根据粒度对同类话单数据进行汇总并加上一些我们想增添的信息,如主叫性质,整理后加载到数据仓库中。
有了这样面向分析而设计的话单数据就可以对历年来大量的长话、网话话单数据和用户的档案资料等相关数据进行分析,通过对用户的分类,从消费能力、消费习惯、消费周期等诸方面对用户的话费行为进行分析和预测。还可以通过对通话起止时间及通话时长分析得到各类用户的通话时段分布情况及日消费高峰、月消费高峰;长话的消费时间、消费次数,及什么地方的用户消费能力较高,什么地方的用户消费能力偏低;以及话费流失的分析。

2
、优惠策略分析

电信企业经常推出各种优惠措施推广新业务和吸引扩大业务量。优惠促销固然可以开拓市场,但如果优惠策略不恰当,结果也可能适得其反。如果利用数据仓库技术建立优惠模型,实现优惠策略的仿真,根据优惠策略进行模拟计费和模拟出帐,其仿真结果将提示所制定的优惠策略是否合适,并可按情况进行调整、优化,使优惠策略的出台更有科学依据。在优惠政策实行后,也可以通过数据仓库对优惠效果进行分析、评估,检查优惠效果是否达到。

3
、可定制报表生成

电信企业经营分析需要大量的报表。这些报表的数据都直接来源于电信企业的数据库。因此,业务人员只知道需要哪些数据,却不知道如何得到他们,虽然一般在开发软件时开发商一般都会根据企业需求开发出一些固定格式的报表程序来满足企业需要,但电信新业务层出不穷,企业经营瞬息万变,报表种类与报表格式常常要发生变化。这时候,业务人员往往求助于维护人员。但维护人员不一定理解业务人员的想法,也不一定理解数据库的每个细节,因此他给出的统计结果可能会有误差。而且,这样的查询往往是手工进行,表格也手工制作,费时费力,难以管理。
利用数据仓库为自定义生成报表提供了可能。数据仓库为经营者提供多维数据源,业务人员可以根据报表样式通过报表生成系统对数据源进行调整、配置,从而自己可以定制符合自己需求的报表。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值