现阶段,主数据整合概念又再次进入了大家的研究领域,多年的信息化实战证明,缺乏MDM才是现阶段数字化世界严重混乱的主因,直接导致了大量信息的泛滥,有用信息沉于海底不能被有效被利用,虽然百度,谷哥等搜索引擎投入了大量的人力物力来提高搜索的精准性,但是这无异于杯水车薪,撼而无用!
什么是主数据?大家现在的见解还不能得到一致,MDM不是学术界当前在推的东西,但是MDM已经被商业化应用反复尝试了很多次,最开始人们完全把他当作了一项技术来应用,但是事实证明这种理解是错误的;第二次人们把它当作了一个产品来研发,比如现在的微软,ORACLE,等等好多著名IT公司,都开发出了所谓的实现数据整合相应的产品,但是我这里还要再次说,MDM还有更大的涵义,意味着更深层次的整合,第三次MDM的整合,势必是通过制定全世界行业规则,从而对于数据内在含义进行规范,保障全世界各处的数据都是可通过规范被识别,被利用,从而保障整个IT世界的数据都是从现有的XML格式元数据转向语义元数据,提高搜索引擎的命中精确度,加强各类数据整合的力度.
那什么又是行业规则呢?简单来说就是数据规范,比如制造行业对于各类机械器件都是通过国标来标注每个零件的型号,这种零件无论拿到世界各处都可以被辨认出是什么型号的,再举个例子,公司里面的财务帐目,都是通过科目来进行帐务处理,而财务科目的制定是由国家法规规定的,至少中国内任何一本帐本里的数据都可以被看明白.
而对于这类规则的研究,很多传统科学研究必定有可借鉴之处.例如传统的情报学就是研究各类规则的组合,只不过以前是面向书本中的知识,现在是面向的电子化数据.新兴情报学的兴起,证实了此类传统规则的可拓展应用性,无论是搜索引擎,还是数据整合,都离不开此类规则的指导.如果将信息管理的编码规则这一原理应用到我们IT世界的数据整合中,那么产生的影响将是深远的.
MDM研究的还不应止步于我们信息化的应用,更可能指导我们未来世界的智能化研究.但建立一对一的规则,并不是说我们任何事物都需要对应,更现实的对应规则是,以一通百,如我要翻译任何一门语言,我可能最先选择一种最广泛的语言,比如英语,以英语为核心,我再翻译法语书籍,翻译俄语德语书籍,而不是建立两两对应规则.等等
可以说MDM的研究应该包含各门学科,各个领域,是对自然法则的物化翻译和重新模拟,而IT只是由这种模拟规则撑起的世界! (作者:周欢)