Dataphin作为阿里巴巴数据中台OneData (OneModel、OneID、OneService)方法论的产品载体,帮助企业构建三大数据中心:基于数据集成形成的垂直数据中心、基于数据开发沉淀的公共数据中心和基于标签工厂构建的萃取数据中心。今天我们就一起来看看,Dataphin是如何基于OneID思想构建数据萃取中心,连接上下游应用为企业创造更多价值的吧~
- 为什么要建立萃取数据中心:提升数据价值密度
首先,我们来看看Dataphin为什么要帮助企业构建自己的萃取数据中心?
大数据时代,任何微小的数据都可能产生不可思议的价值。作为智能数据构建与管理平台,Dataphin的规范建模、数据处理等核心功能帮助企业高效整合来自不同业务数据库的海量数据,沉淀数据资产,构建自己的数据中台,应对大数据时代Volume(大量)、Variety(多样)、Velocity(高速)方面的挑战。然而,相比于传统的小数据,大数据更大的价值在于从海量不相关的各类数据中,挖掘出对预测分析有参考意义的数据,提升数据价值密度并应用于指导生产,从而帮助企业实现提效降本的目的。Dataphin的数据萃取功能正提供了这样的能力。
从业务视角来看,日常生产和营销活动中,不管是人群圈选、选址还是个性化投放,都离不开标签的指导。标签是对一个实体的立体刻画(不局限于人,任何可被描述和分析的存在都可以是实体,如商品、公司等)。不同维度的标签从不同角度对实体进行描述,例如以零售视角为切入点,我们可以从自然属性(如性别、年龄)、社会属性(如经济状况、婚姻状态)、兴趣偏好(如喜欢整洁的环境、希望有漂亮的牙齿&