简介:关于数据相关的词条很多,虽然有不同的定义,但是本质上是相辅相成,通常结合使用才能拿到结果。类比词条诸如 数据分析,数据挖掘, 数据洞察。本文将聊聊我们在业务链路升级中做的数据洞察。
作者 | 金铎
来源 | 阿里技术公众号
一 概述
关于数据相关的词条很多,虽然有不同的定义,但是本质上是相辅相成,通常结合使用才能拿到结果。
类比词条诸如 数据分析,数据挖掘, 数据洞察。
以下为wiki上的定义
- 数据分析:是一种统计学常用方法,其主要特点是多维性和描述性。有些几何方法有助于揭示不同的数据之间存在的关系,并绘制出统计信息图,以更简洁的解释这些数据中包含的主要信息;
- 数据挖掘:是一个跨学科的计算机科学分支。它是用人工智能、机器学习、统计学和数据库的交叉方法在相对较大型的数据集中发现模式的计算过程;
- 数据洞察:这一项目前没有wiki词条,基于普遍认知,是基于数据分析和数据挖掘,结合业务场景后,围绕业务链路定义统一口径,进而更好的分析问题,并且能够进一步做策略改进。
三者分析手段本质上都是对数据进行加工获取信息,但是目标不尽相同,以下是我个人的理解。
- 数据分析更侧重,基于人的理解动线,结合人对业务和数据的理解,产出分析结果。这里更加强调人的分析;
- 数据挖掘同理数据分析,只不过角色从人变为了机器;
- 数据洞察是在数据分析和挖掘的基础上,引入了业务场景的概念,梳理出围绕业务场景结果的影响因素和链路,目标是对抽象问题进行归因、拆分以及更好更快的形成改进方向。这个也是我们业务开发同学最有优势的地方。
二 核心要素
我们发现,数据洞察的理解,实际上是可以分为几个核心要素。
这里我们逐一来简要说明。
1 数据
干净有效的数据才是我们要的数据,否则会误导后续的结论。e.g. 登录链路因为是业务安全水位保证的第一环节,