导读:本文将对数据中台、数据、标签相关的关键名词术语进行定义和解释。
作者:任寅姿 季乐乐
来源:大数据DT(ID:hzdashuju)
01 数据
数据是指对客观事件进行记录并可以鉴别的符号,是对客观事物的性质、状态及相互关系等进行记载的物理符号或这些物理符号的组合。数据可以是连续的,比如声音、图像,称为模拟数据;也可以是离散的,如符号、文字,称为数字数据。在计算机系统中,数据以二进制信息单元0和1的形式表示。
在《标签类目体系》一书所论述的方法论中,“数据类目体系”概念中的“数据”是狭义的定义,单指企业原始拥有的、未经整理的信息载体。
02 数据资产
在传统概念中,企业认为其所拥有的所有数据资源都是数据资产,例如存放了好几十年的纸质文件、光盘、视频、音频等。这些资源还停留在原始数据阶段,必须从中整理和提炼出可用的信息项,才能真正为企业产生价值。
因此当前对数据资产主要关注其精准定义(狭义):由企业拥有或控制的,能够直接为企业带来经济利益的数据资源。通常需要有较好的组织形式,数据资产才可以被编目、被管理、被高效使用。
03 数据中台
数据中台是一套可持续“让企业数据用起来”的机制。数据中台是依据企业特有的业务模式和组织架构,以有形的产品和实施方法论为支撑,构建的一套持续不断把数据变成资产并服务于业务的机制。
04 标签
标签指从原数据加工而来,能够直接为业务所用并产生业务价值的数据载体。从本质上讲,标签本身也是一种数据(或映射指向数据),它是对物理层数据信息项的业务化封装,是数据资产的一种良好组织形式,是一种概念、逻辑定义,因此标签必须是可阅读、易理解的。
从粒度上来讲,标签往往映射为某一对象的属性,包括固有属性和动态属性,一般都需要结构化到字段粒度,保障可被后续数据服务便捷使用。它面向数据应用的业务端,核心解答的是数据怎么用、资产价值在哪里的问题。根据加工方式的不同,标签可以分成基础类标签、统计类标签和算法类标签。