菜鸟数据分析 前4章

菜鸟数据分析

数据分析7部:

  1. 明确分析目的
  2. 确定分析思路
  3. 数据收集和数据处理
  4. 数据分析
  5. 数据展现
  6. 报告撰写

 

 

一、明确分析目的

这个图表是否有效解决了问题?

想:数据变化背后的真相是什么?从哪些角度分析采系统?用什么分析方法最有效?图表是否有效表达出了观点?图表分析的目的达到了么?数据分析报告是否有说服力?

 

二、确定分析思路

PEST分析理论主要用于行业分析

4P分析理论主要用于公司整体运营情况分析‘

用户行为理论较单一,主要用于用户行为分析

5W2H用途比较广泛,可用于用户行为分析,也可用禹业务问题专题分析

 

用户行为分析:

 

用户行为轨迹           用户的网站行为                  网站分析指标

认知                    网站访问                        IP、PV、UV

熟悉                    网站浏览             平均停留时长、跳出率、页面偏好

                        站内搜索                    搜索访问次数占比

试用                    用户注册               注册用户数、注册转化率

使用                    用户登录            登录用户数,人均登录、访问登录比

忠诚                    用户粘性             访问深度、次日、周留存

                        用户流失              用户流失数、流失率

 

 

5W2H的应用

Why(何因)   what(何事)   who(何人) when(何时)  where(何地)

How(如何) how much(何价)       

分析用户的购买行为

why? 用户购买我们产品的目的是什么?我们产品有哪些吸引人的地方

what?  我们公司提供什么样的产品或服务?与用户需求是否保持一致?

who ?    我们的核心用户是谁? 用户有什么特点?

when?  何时购买?多久再次购买?

Where?在什么地方购买?各地区购买用户占比是什么样子的

How?  用户购买支付方式是怎么样?

How much? 用户购买花费的时间成本是多少?交通成本?

 

 

  • 数据处理

3.1数据清洗:将多于重复的数据筛选清除,将缺失的数据补充完整,将错误的数据纠正或删除.

 

3.1.1重复数据的处理:

  • Countif法 识别重复值数量

Countif(A:A,A2)  

其他单元格 countif(A:A,A2)

           countif(A:A,A3)

           countif(A:A,A4)

方便看出哪些是重复的数据,那些不是重复数据,但不能做到让后续每个数据出现一次

 

  • Countif(A$2:A2,A2) 

其他单元格 Countif(A$2:A3,A3)

                       Countif(A$2:A4,A4)

Countif(A$2:A5,A5)

方便进行后续筛选,让每个数据都出现一次

 

  • 条件格式法,突出重复值单元格

 

3.1.2缺失数据的处理:常见的形式为空值或错误标识符

  1. 空值: 常采用样本缺失值来代替

计算出样本平均值,定位Ctrl+g,输入值,Ctrl+enter

  1. 错误标识符:Ctrl+H替换 Ctrl+F查找

    替换内容 #DIV/0   替换为:0

 

3.1.3检查数据的逻辑错误

If+条件格式

例如最多选项三个的多选题: 有可能的错误:答题者选择的选项超过了3个,录入者录入的数据出现了除“0”,“1”之外的数据。

先用if检查超过3个的

I3=if(countif(B3:H3,”<>0”)>3,“错误”,“正确”

在用条件格式检查第二类错误,将非“0”,”1”的数据用红色加粗斜体字突出显示,

开始→条件格式→突出显示单元格规则→其他规则→使用公式确定要设置格式的单元格→输入 =or(B3=1,B3=0)=FALSE (如果B3为1或者B3为0的命题是错误的(=FALSE),即B3既不为0也不为1,则会被条件格式突出标记出来。

 

3.2数据加工:对数据字段进行信息提取、计算、分组、转换等加工

 

3.2.1数据抽取

字段分列: 菜单法:数据→分列

      函数法:=left(text,[num_chars]), 取文本左侧几个字符

                   =right(text,[num_chars]),取文本右侧几个字符

 

字段合并:   =A2&“迟到”&B2&“次”

            =concatenate(A2,“迟到”,B2,“次”)

字段匹配:vlookup函数

 

3.2.2数据计算

简单计算

加减乘除可直接=B2*C2

快捷求和、平均值,找出最大值最小值:开始→编辑→求和选项及下拉菜单

 

函数计算:

平均值average

求和 sum

显示日期:2018-10-10   =today()    快捷键ctrl+;

            11:04             快捷键 ctrl+shift+;

   2018-10-10 11:04  =now()  快捷键:ctrl+; 再按空格,再按ctrl+shift+;

注:快捷键静态,公式动态

 

日期加减法:若为加几天,直接=A1+5

若添加年月份,则DATE函数

=DATE(YEAR(A2)+2,MONTH(A2)+1,DAY(A2)+5)

计算工龄:

Dateif函数

DATEIF(start_date,end_date,unit)

Unit: y整年数 ,m 整月数,d天数,md为天数差,忽略月和年,ym为月数差,忽略日和年,yd为天数差,忽略年

=dateif(B1,B2,”y”)&”年”&dateif(B1,B2,”ym”)&”月”

 

3.2.4数据分列

Vlookup的模糊查询法,range_vlookup=1或省略range_vlookup

 

3.2.5数据转换

数据表的行列转换:选择性粘贴

3.2.6数据抽样

Rand函数

 

  • 数据分析

4.1数据分析方法:(自己找实例多练!!!)

数据分析作用

基本方法

数据分析方法

现状分析

对比

对比分析

平均分析

综合评价分析

。。。

原因分析

细分

分组分析

结构分析、矩阵关联分析

交叉分析、漏斗图分析

聚类分析、杜邦分析

预测分析

预测

回归分析

时间序列

决策树、神经网络

 

4.1.1对比分析法

特点:可以很直观的看出事物某方面的变化或差距,并且可以准确、量化的表示出这种变化或者差距是多少。

实践应用:与目标对比;不同时期对比;同级部门、单位、地区对比;行业内对比,活动效果对比

 

4.1.2分组分析

把总体中带有不同性质的对象区分开,把性质相同的对象结合在一起,保持各组对象属性的一致性,组与组之间属性的差异性,以便进一步运用各种数据分析方法来结构内在的数量关系,因此分组法必须与对比法结合运用。

 

4.1.3结构分析法

部分与总体之间的对比分析方法,主要评价企业运营状况是否良好

 

4.1.4平均分析法

一般用于同一现象在不同地区、不同部门或单位间的对比,还可用于统一现象在不同时间的对比

主要作用:李永平均指标对比同类现象在不同地区、不同行业、不同类型单位等之间的差异程度,必用总量指标更具有说服力

利用平均指标对比有些现象在不同时期的变化,更能说明其发展趋势和规律

平均指标有算术平均数、几何平均数、众数和中位数

平均分析法和分组和指标分析法一起用

 

4.1.5交叉分析法

常用于分析2个变量之间的关系,即同时将两个有一定联系的变量及其值交叉排列在一张表格内。

 

4.1.6综合评价分析法

  1. 确定综合评价指标体系,既包含哪些指标
  2. 收集数据,并对不同计量单位的指标数据进行标准化处理
  3. 确定指标体系中各指标的权重,保证评价的科学性
  4. 对处理后的指标进行汇总,计算出综合评价指数或综合评价分值
  5. 根据评价指数或分值进行排序,并得出结论。

特点:在评价过程中要根据指标的重要性进行加权处理

数据标准化的方法:将数据按比例缩放,使之落入小的特定区间,有0-1标准化法

第n个经标准化处理得值=(第N个原始值-最小值)/(最大值-最小值)

权重确定方法:目标矩阵优化表法来计算权重

 

4.1.7杜邦分析法

金字塔结构,由上往下分析

可以用于财务分析、企业市场、用户分析

 

4.1.8漏斗图分析法

可以很快发现业务流程中存在问题的环节

适合业务流程比较规范,周期比较长、各流程环节设计复杂业务过程比较多的管理分析工具。

 

4.1.9矩阵关联分析法

在营销活动中应用广泛,对销售管理起到指导、促进、提高的作用,而且在战略定位、市场定位、产品定位、用户细分、满意度研究等方面都有较多的应用。

 

4.1.10其他分析方法

产品研究:相关分析、对应分析、判别分析、结合分析、多维尺度分析

市场细分:聚类分析、判别分析、因子分析、对应分析、多维尺度分析、Logistic回归、决策树

满意度研究:相关分析、回归分析、主成分分析、因子分析、对应分析、logistic回归、决策树、关联规程

 

4.2数据分析工具

数据透视表

 

 

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值