1.什么是“数据模型”
现实中人物的复杂关系,可以通过一个简单的树形结构清晰地表达出来,这就是一个数据模型。当然,我们也可以通过一个Excel表格,每行记录一个人名,再列出他的父亲是谁,兄弟是谁,这也是一个数据模型。简言之,数据模型就是对现实世界抽象化的数据展示。数据模型在满足抽象的同时,越简单越好。
摘自:《数据驱动:从方法到实践》 — 桑文锋
eg: 人 、货、场 模型
2.数据分析方法
a. 行为事件分析
行为事件分析涉及事件、维度和指标三个概念。在分析过程中,一般期望数据是实时采集并能够实时分析的,而事件、维度和指标是可以灵活自定义的
行为事件分析法具有强大的筛选、分组和聚合能力,逻辑清晰且使用简单,已被广泛应用。行为事件分析法一般经过事件定义与选择、多维度下钻分析、解释与结论等环节。
b.漏斗分析
漏斗分析是一套流程分析,它能够科学反映用户的行为状态以及从起点到终点各阶段用户转化率情况的重要分析模型。
c.留存分析
留存分析是一种用来分析用户参与情况和活跃程度的分析模型,考察进行初始行为的用户中,有多少人会进行后续行为。这是用来衡量产品对用户价值高低的重要方法
d.分布分析
分布分析是用户在特定指标下的频次、总额等的归类展现。它可以展现出单用户对产品的依赖程度,分析客户在不同地区、不同时段所购买的不同类型的产品数量、购买频次等,帮助运营人员了解当前的客户状态,以及客户的运转情况。如订单金额(100以下区间、100元~200元区间、200元以上区间等)、购买次数(5次以下、5~10次、10以上)等用户的分布情况。
e. 点击分析
点击分析的定义
点击分析,即应用一种特殊高亮的颜色形式,显示页面或页面组(结构相同的页面,如商品详情页、官网博客等)区域中不同元素点击密度的图示。包括元素被点击的次数、占比、发生点击的用户列表、按钮的当前与历史内容等因素。
f.用户路径
用户行为路径分析,顾名思义,是用户在APP或网站中的访问行为路径。为了衡量网站优化的效果或营销推广的效果,以及了解用户行为偏好,我们时常要对访问路径的转换数据进行分析
用户路径的分析结果通常以桑基图形式展现,以目标事件为起点或终点,查看后续或前置路径,可以详细查看某个节点事件的流向,总的来说,科学的用户路径分析能够带来以下价值。
g. 用户分群
用户分群即用户信息标签化,通过用户的历史行为路径、行为特征、偏好等属性,我们将具有相同属性的用户划分为一个群体,并进行后续分析
用户分群通常被分为普通分群和预测分群。普通分群根据用户的属性特征和行为特征将用户群体进行分类,预测分群根据用户以往的行为属性特征,运用机器学习算法来预测他们将来会发生某些事件的概率
h. 属性分析
属性分析
仅知道一幢房子的面积无法全面衡量其价值大小,而房子的位置、风格、是否学区、交通环境更是相关的属性。同样,用户各维度属性都是进行全面衡量用户画像不可或缺的内容。
属性分析的定义
顾名思义,属性分析根据用户自身属性对用户进行分类与统计分析,比如查看用户数量在注册时间上的变化趋势、查看用户按省份的分布情况。用户属性涉及用户信息,如姓名、年龄、家庭、婚姻状况、性别、最高教育程度等自然信息,也有产品相关属性,如用户常驻省市、用户等级、用户首次访问渠道来源等。
我们逐一介绍了各大数据分析模型,实际上各分析模型应该是一个综合体,它们之间存在无法割裂的关系。各分析模型实现科学互动和配合,能够科学揭示出用户个人或群体行为的潜在规律,并据此做出理论推导,不断在工作实践中优化商业决策和产品智能。
3. 构建指标体系
a.第一关键指标法
b.海盗指标法
4. 典型的机器学习处理流程
问题分析、数据清洗、特征工程、模型训练、模型验证。
对于机器学习算法而言,数据清洗与特征工程是最重要的一部分工作。通过特征工程,我们可以将对解决问题有意义的关键信息从海量数据中抽取出来,让数据中的“规则”浮现,同时结合自己的先验知识更有效地进行处理和分析