本文整理自DTCC2016主题演讲内容,录音整理及文字编辑IT168@田晓旭@老鱼。如需转载,请先联系本公众号获取授权!
演讲嘉宾
![](https://i-blog.csdnimg.cn/blog_migrate/2cfaa97060f852ca1d086a26882abec9.png)
郑保卫
恩核(北京)创始人兼技术总监
于2013年12月被北京市朝阳区认定为“凤凰计划”海外高层次人才,参与过大量关于数据架构、数据建模、数据治理、系统性能优化等方面项目,长期致力于数据架构及数据治理技术方面的研究和实践。荣获2015年中国大数据领域领军人物奖,由国家信息公共服务平台及国家软件公共公共服务平台颁发。
分享内容
![](https://i-blog.csdnimg.cn/blog_migrate/2cfaa97060f852ca1d086a26882abec9.png)
大家好,今天我主要想和大家分享一些数据治理的经验和数据模型管控的方法。其实数据治理的难度很大,因为牵扯的东西太多、外围的环境太复杂。尤其是IT系统建设到一定程度的时候,你才开始做数据治理,难度真的会非常大。数据治理的技术问题不大,但是想要落地却不是那么简单。我主要讲解2个方面的内容:第一个是数据治理遇到的困难,通过什么样的方式才能保证数据治理的落地。第二个是数据模型的管控方案。
从去年的后半年开始,我们就可以非常明显的感觉到传统行业都开始做数据治理了。最近,我去过至少20家左右的银行,他们无一例外都在做数据治理。他们通常的做法是先找咨询公司做咨询,做完咨询之后开始往下一步走。一般咨询公司都是做两件事。第一个是设计数据主题域,其实就是业务元数据,把企业的数据分成几个大的主题域,并定义每个域里面包含哪些数据项。第二个是定义数据标准,主要是定义业务用语,包括它的内容、英文含义等等。做得深入的一些企业,数据治理成果在数据仓库建设过程中可能已经落地,但是效果不是太好。还有一些企业可能有自己的数据部门,比如跨区域性的银行的数据部门可能有十几个人左右、地区性的银行可能只有四五个人。
IT建设从60年代开始,软硬件技术在发生翻天覆地的变化,但是数据方面的技术和应用却在不断深化,从最早的数据应用、存储到现在的数据分析、管理、统计、整合、挖掘等。
大家有没有思考过为什么从去年的后半年到今年为止,数据治理会这么火?前两年很多企业都在做大数据应用,但是传统企业几乎都是很惨烈的失败了,为什么?技术人员说数据质量太差了,然后领导就会问怎么办?那就做数据治理呗。基于这个原因,今年有很多企业在尝试做数据治理。
现在,数据治理已经是一个普遍的话题了。前两年我还在给大家宣讲什么是数据治理?怎么做数据治理?现在不用讲这个事情了,我去很多客户发现他们已经在做了。