引言
随着增长黑客的出现,很多公司出现了专职的数据产品经理岗位,随着流量增长放缓,更多的公司也加入到精细化运营的队伍,而数据产品岗位,也按照平台型、应用型、策略型进行了进一步细分。
数据产品经常会接触到用户画像、数据标签、维度、度量这些抽象的概念,但是,在理解这些业务向的概念之前,我建议先理解以下的几个概念,为深入理解业务语义下的概念打下良好的基础。
01 | 数字
「数字」是一种用来表示数的书写符号。
在古代,计数的符号因地域而不同,中国人用“一、二、三”,阿拉伯人用“1、2、3”,罗马人用“I、II、III”。在当代中国,有种特殊的学习数字的方式:
当前人界通用的是计数方法是十进制阿拉伯数字,计算机的计数方法是二进制。
02 | 数据
「数据」是指对客观事件进行记录并可以鉴别的符号,是对客观事物的性质、状态以及相互关系等进行记载的物理符号或这些物理符号的组合。
简单说,数据是可识别的、抽象的符号。数字也是数据的一种呈现方式。
03 | 元数据
元数据,是解释数据的数据。
「数据的解释」是对数据含义的说明。
如果把表头遮挡,“301”,到底是分数,还是宿舍号呢?周大福,到底是人名,品牌名呢?
当数据缺少了解释,数据就失去了业务语义,故而,数据和数据解释密不可分。
在数据仓库领域,「元数据」用于定义数据的解释。元数据有很多种类型,限于篇幅和目的,这里不展开讲。
04 | 模型 & 数据模型
「模型」是指通过主观意识借助实体或者虚拟表现构成客观阐述形态结构的一种表达目的的物件(物件并不等于物体,不局限于实体与虚拟)。
我们来通过一个例子理解。当我们看到一辆宝马,如何给没亲眼看到的人描述这辆车呢?
一种方式,是给别人看等比例缩放的车模,这样可以描述颜色、车型等信息,别人一看就明白。
如果没有车模,还有另外一些方式,比如可以用文字+简单图像的方式进行更加抽象化地描述,虽然损失掉了很多细节信息,但是至少描述了车的核心构成。
简单来说:如果一件事物能随着另一件事物的改变而改变,那么此事物就是另一件事物的模型。
在上述例子中,如果实体的宝马汽车发生了变化,那么描述汽车实体的车模、抽象模型也都根据实际情况进行相应的变化。
「数据模型」是指用数据阐述客观事务或实体的形态、结构特征的模型,比如下面的数据项:
上述例子,就用数据的方式,描绘了一个考生应该有哪些信息项,进而为考生信息数据的存储格式定义、检验提供了依据。
05 | 标准 & 数据标准
「标准」是对重复性事物和概念所做的统一规定,他以科学技术和实践经验的结合成果为基础,经有关方面协商一致,由主管机构批准,以特定形式发布作为共同遵守的准则和依据。
在我们的生活中,也有很多的显性或者隐性的规范和约束,显性的有法律法规、民事法典,隐性的有人们心中的道德规范、价值观和行为准则。
图例中的标准是狭义的,即该标准被制定后,指定范围内的人都要遵守。其实还有广义的标准,即任何人都可以定义自己的标准。
「数据标准」是从用数据描述世界的视角出发,对数据分类、记录格式和编码等进行地统一定义的物件(物件并不等于物体,不局限于实体与虚拟)
数据标准制定后,不同的建设方将可以按照统一的规则定义数据存储,实现数据的交换和共享。
写在最后
在构建数据仓库、设计数据标签、构建算法模型的过程中,都会接触到这些简单而非常底层的概念,这些概念看似简单,但也需要花点时间领悟,一次性理解清楚这些概念,将有助于我们关注业务层面的问题。
数字化的世界,数据的价值无线大。
夯实基础,大胆迈步,冲鸭!