CDA 数据分析师 Level1 基本知识(3)--知识点梳理

考点1:撰写业务分析报告

定义:时间段内的综合性事件评估

作用:了解该事件段内的业务事实表现

分类:静态报告:WorD,PDF或PPT的格式可视化看板:交互式可视化

流程

1.业务理解:抓住问题核心(需求是什么,通过哪些字段呈现),定位决策者角色,设定报告框架

2.数据收集:系统数据收集,人工维护数据,外部数据支持

3.数据处理:字段标准统一,多表数据关联,异常数据整理

4.数据分析:数据探索,运用分析方法,结合高效工具

5.图标制作

6:报告绘制:组合图表,撰写报告结论

常用句式:通过/基于分析【数据事实】,发现【业务强弱】,考虑【业务原因】/建议【改进方案】

指定决策方案是数据据分析结果的应用环节

业务分析报告作用: 1)评估业务行为好坏情况 2)发现市场商业机会及合作机会 3)检验业务结果的真实性 4)发现问题及提出问题的解决方案

撰写报告 应该: 1)进行有合理依据的适当推测(适度主观推测判断 ,作为推测判断信息来源的渠道应权威,信息应准确无误,如新联联播); 2)根据数据给出建议; 3)对数据进行归纳总结性描述 不应:文字不应重复描述图表可直接传递的内容

常考知识点:

业务分析报告分为日常通报型,周期回顾型,专题通报型

业务场景下的毛利一般情况下指收入-成本

维度分析扩展知识点:大数据之维度建模中的重要概念_柳小葱的博客-CSDN博客_大数据建模的概念

考点2 BI报表

BI是将数据仓库(DW)、联机分析处理(OLAP)、数据挖掘(DM)等技术与客户关系管理(CRM)等结合起来应用于商业活动实际过程当中,实现了技术服务于决策的目的

整体而言,就是以数据可视化和分析技术为主,具备一定的数据链接,数据钻取,数据分析和处理能力的软件,使使用者通过可视化的界面通过简单的设置快速制作多种类型的数据报表,数据图形等内容的展示。

设计BI报表界面注意事项:

1.不放重复内容的图表 2.根据业务逻辑有条理地进行布局 3.汇总维度不宜过多 4.获取信息的方式应简单直观

常考知识点:

1.BI报表使用DW汇总不同数据源作为自己数据源使用

2.BI分析的主要特点是多维度下的透视分析

3.BI报表设计的核心内容是明确业务涉及到的维度与度量

4.BI分析工具包括:Tableau,Smart BI,Power BI

5.BI报表与业务分析报告的差异在与使用的数据源不同,描述侧重点不同,呈现方式不同,侧重业务面的完整描述,动态信息展现,以图表表格为主要展示形式,基于多源数据环境制作

考点3 图表

考点图表分四类:构成表,比较表,序列表,描述表,4种表关系构成业务图表决策树,如下

比较类图表,通常用于突出对象间的差异程度,通常使用对象是2个不同的对象,条形图对比1个指标 散点图对比2个指标,xy轴各一个 气泡图对比3个指标,又加了气泡大小 雷达图可对比n个指标,只要可读性可以就行,一般在5-6个指标的时候图形好看些,既能看各个指标的对比,还可以看单个指标的总体轮廓。

构成类图表:通常以百分数作为数据源

描述类图表:展现一组数据的统计分布情况,不能使用业务维度作为坐标轴,可以使用年份作为坐标轴

序列类图表:按趋势(时间,状态)递进的图表

波士顿矩阵适用于对商品结构的描述而不是客户行为分析,明星类产品的特征是增长率和市场占有率高

帕累托分析用来定义重点对象

销售阶段转换情况适用于漏斗模型分析,用来描述推进力度

动销天数用来辅助描述销售行为的风险程度而不是好坏程度

数据驱动型业务模式也需要经验指导,以经验为主数据为辅,

预测性分析不属于描述性分析

长周期指标适合做同环比分析

销售绩效可以用同环比或者目标比

一个品牌下有多种产品

跨表筛选应满足维度和公共字段是父子级关系

皮尔逊相关系数越小,显著性P值越大,越不显著

饼图的特征:分项之和应是完整逻辑意义上的整体,数据标签应尽量使用百分比形式展示,扇区不宜过多,属于结构类图表

5W2H的作用是先对业务场景进行概括性总结,然后进行维度梳理,落实到具体的维度数据表中,最后落实到字段

2八分析中用于时间状态下状态变化情况分析场景

波士顿矩阵是商品矩阵,不能用来分类

考点4.可视化报表

可视化报表的创建过程:1.业务理解,2.整体设计,3.数据收集。4.数据加工处理,5.搭建多维数据环境,6.创建复杂汇总规则,7.数据展现

可视化报表的作用全面描述一个完整业务的场景情况,围绕某个业务问题进行全面的数据展现

用恰当的工具结合正确的操作完成从数据收集到创建复杂汇总规则的工作:5W2H思维模型,ETL→ETL,DW→OLAP→OLAP

业务理解的方法:与业务人员或决策者进行多次深入地访谈→实际业务工作中学习→查阅相关业务资料

整体设计的内容:整体设计是连接业务需求与可视化报表成果之间的桥梁思维路径,设计思路

 考点5.指标分析

纵向分析指时间周期下指标的变化规律,横向分析指指定维度下不同项的指标值差异,预警分析指提供当前时点对应维度的指标累计值或瞬时值,对比基准值梳理处理,

跳失率越高,流量付费的可能性越低,流量质量越差

漏斗模型适用于对动态递进的行为状态变化进行监控分析

收入(销售额)= 客流量 * 转化率 * 客单价

客流量分为免费流量,付费流量,活动流量。客单价=销售额/购买顾客人数,

转化率 转化率的影响因素有很多,商品、图片、评论、活动力度等等都有可能影响一个订单的成交,深入了解转化率的影响因素,也就可以从这些影响因素中去挖掘提升转化率的方法

基本指标分为:求和类(了解各数据的整体情况,常结合数值型数据使用),计数类(了解各数据的数量情况,常结合文本型数据使用),比较类(作为参照指标,评定主指标的表现)

CRISP-DM模型是应用最广泛的KDD过程模型:步骤: 1)商业理解 2)数据理解 3)数据准备 4)建模 5)模型评估 6)模型部署(发布)

 考点6.维度模型

多维数据模型,又叫多维数据集、立方体,指的是相互通过某种联系补关联在一起的不同类别的数据集合

创建方法:通过公共字段连接两表,选择不同表中字段分别做为维度、度量,选择汇总计算规则。

影响连接汇总三要素:筛选器方向,对应关系,汇总角色

筛选器方向分为单向及双向两种、筛选器方向决定维度与度量的出处

对应关系分为分为三类,一对一,多对一与多对多,决定连接汇总的结果,相邻两表间应尽量使用一对多的连接关系,汇总时应遵循一表出维度,多表出度量的规则

汇总角色指维度,度量

5W2H思维模型,what,why,where,who,when,how much,how to do,

思维步骤: 1)将业务场景进行5W2H的概括总结 2)将5W2H总结内容梳理为业务维度 3)将业务维度梳理为数据表 4)将数据表展开到字段

考点6.透视规则

 考点7.名词介绍

OLAP联机分析处理,是搭建多维数据模型的处理过程
OLTP联机事务处理
DW数据仓库
ETL抽取,转换,加载功能
UML统一建模语言的缩写
EDIT探索Expolration,诊断Diagnosis,指导Instruction,工具Tool
RDBMS关系型数据库管理系统,主要任务是企业业务数据的存储,检索,访问与共享
DEFAULT自动值
CPS(COST PER SALES)按实际付费金额占比收费
CPM(COST PER MILLE)按每千次曝光收费
SKU库存量单位,是商品的最小单位,应精确到最细的具体产品上
SPU商品的品类细分,比大品类细,比具体商品粗,翻译过来就是标准产品单位)
ARPU每用户平均收入,是评估AARRR模型效果的重要参考指标之一
UV当日到店人数统计
PV浏览量
Vistis浏览次数,一进一出即为一次流量
DB是BI项目之外的数据源
DB2关系型数据库管理系统
CRISP-DM商业理解,数据理解,数据准备,建模,模型评估,模型部署,KDD工程描述
AARRR用户获取,用户激活,用户留存,获得收益,推荐传播(K值)
  • 4
    点赞
  • 32
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值