数据标准化

从广义上来讲,数据标准化的过程可以看作是业务系统内部或业务系统之间,乃至整个数据治理系统中的一个“语言”统一的过程。
只有语言统一,才能让同一业务系统或者不同业务系统之间有了对话、调用、通信的可能,从而保证使用的都是特定的某一个方言。
同样,数据标准化的过程反映程序及系统设计或架构级别时,就可以看作连接程序、机器、用户的一个枢纽,通过标准化让程序、机器、用户都明白某一个词素的确切含义,如果引入新系统或者新架构时又可以根据数据库中的信息进行对照从而确定是否有该词素,如果没有进行相应添加或者同义转换。
建立统一标准后,之后可以通过机器来处理相关词汇,同时可以针对这样的词汇进行一定的分析工作,例如针对某一分类词分类,同时可以定义在数据挖掘或分析过程中的词素,从而通过“约定俗成“的方式来构建一定的语义含义。同时可以依托于关系型数据库完成一定的语义分析以及相应的标准判定。
此时,我们就需要认真对待一个问题——标准词汇的来源。
标准词汇如果从某一个系统来,可能会影响其他系统语义效果。所以,从某种意义上来说,标准化词汇的构建过程可以实现与系统逐渐进行标准的步骤相统一。更明白点来说,在就是你通过标准化词汇的构建过程发现系统中目前存在的词汇问题,从而实现对这些词汇的纠正,同时,尽量使用词汇中对应词汇构建系统,从而保证将来发生词汇含义的变化时,主动发生属性变化。似乎还是没有说明词汇来源的问题,其实,上面说的就是一个数据的标准修正,而标准词汇又可以看作是元数据描述数据,如果你愿意你可以称之为元元数据。元数据我们可以从领域、行业、国家等标准中获取,之后根据公司或项目的特点构建或者设计,然后在此基础上对元数据进行分类,进行描述、拆分,从而获取标准词汇。当然在构建具体应用时也可以按需引入自身的词汇,但此时需要认真进行分析。
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值