数据分析-内容整理

一、认识数据分析

1.数据分析是指用合适的统计分析方法对收集来的数据进行分析,将这些大量的数据进行汇总,并做成可以被人们消化和理解的资料,从中提取有用的信息。

2.数据分析的基本步骤(6个,缺一不可,相辅相成)

(1)明确分析目的:不要偏离分析方向,确保工作有效进行。

(2)数据收集:按照确定的数据分析目的来收集相关数据的过程,为分析提供依据。

数据的来源一般有4个渠道:数据库(企业业务相关性最强),互联网(资源丰富),市场调查(客观),公开出版物(权威和真实性较强)

(3)数据处理:包含以下7个方面一个或多个的组合,最后绘制成文字和数字的表格或图表。

数据采集:采集所需的信息。

数据分组:指定编码,按有关信息进行有效分组。

数据组织:整理数据或用某些方法安排数据。

数据计算:进行各种算术和逻辑运算。

数据存储,数据检索,数据排序。

(4)数据分析:三种方式——定性数据分析、验证性数据分析(证实)、探索性数据分析(发现)

(5)数据展现:通常通过图形,如柱状图,条形图,折线图来进行展现,能直观看到其中的规律和变化。

(6)报告撰写:是对整个数据分析过程的总结,给企业决策者提供参考,为决策者提供科学、严谨的决策依据。一份优秀完备的数据报告应当包含:一个明确的主题,一个清晰地目录,图文并茂的阐述,条理清晰的展现,使决策者能一目了然看出报告的核心内容,最后需要加上结论以及建议方案。

3.数据分析的4大误区

(1)忽略数据分析的核心,为了数据而分析

应当围绕企业现状、业务变动情况及原因,预测未来趋势来进行分析。

(2)忽略业务知识,数据偏离实际轨道。应该从企业业务出发,需要管理、营销、策略的综合知识。

(3)忽略业务问题,追求高级分析模型。应该说明业务的问题,原因及解决方法,这些才是重要的。

(4)为数据而找数据。应该保持客观中立的分析数据,不要为了迎合观点而去找数据。

4.常用术语

(1)平均数

平均数=全部数据的总和/数据总个数,是对数据集中趋势的反映,平均数包括算术平均数、几何平均数、调和平均数、众数和中位数。算术平均数的优点是可以代表总体一般的水平,掩盖了总体内个体的差异;缺点是易受到极端值的影响。

(2)百分比与百分点

百分比(百分率、百分数%),表示一个数是另一个数的百分之几。

百分点是指不同时期以百分数的形式表示的相对指标的变动幅度(提高、降低),是以1%作为度量单位,12%就是12个百分点。

(3)比例与比率

比率是指在总体中,各部分的数值占整体数值的比重,反映总体的构成和结构。

比例是指不同类别数值的对比,它反映的不是部分与整体的关系,而是一个整体中各部分之间的关系。

(4)倍数与番数

倍数是一个数除以另一个数得的商,一般表示数量的增长或上升幅度。

番数是原来数量的2的N次方倍,如翻一番为原来数量的2倍,翻两番为4倍。

(5)绝对数与相对数

绝对数可以反映:在一定时间、地点、条件下——数量增减变化的绝对数或总规模综合性指标。

想对数用于反映客观现象之间数量。相互间联系的综合指标。

(6)频数与频率

频数是指一组不同类的数据重复出现的次数。

频率是指每组类别次数与总次数的比值,它代表某类别在总体中出现的频繁程度,一般用百分数表示,所有频率相加之和为1.

(还有一些专业术语:环比、同比、用户快照分析、沉睡率、唤醒率、平均回购周期等)

5.数据分析方法论(5种)

(1)5W2H分析法(七何分析法),使用广泛,具体为:为什么(why),做什么(what),谁来做(who),什么时候(when),什么地方(where),如何做(How),什么价格(How much)(可用于用户购买行为分析)

(2)用户行为理论

用户行为:用户为获取、使用物品或者服务所采用的各种活动。利用用户行为理论把用户在网站上的访问、浏览、搜索、登录、订购等关键指标的逻辑关系进行梳理与分析。

(3)PEST分析

PEST分析是分析企业外部宏观环境的一种方法,政治环境(Political)、经济环境(Economic)、技术环境(Technological)、社会环境(Social),这四个环境是影响企业的外部环境因素。

(4)4P营销理论

以产品(Product)、价格(Price)、渠道(Place)、宣传(Promotion)为核心的营销组合方法。

(5)逻辑树分析法

逻辑树(问题树、演绎树、分解树),将问题的所有子问题分层罗列,从最高层开始逐步向下扩展。

补充:8种最基本的数据分析方法:对比分析法、分组分析法、交叉分析法、结构分析法、矩阵关联分析法、因素分析法、漏斗分析法、综合评价分析法。

6.数据分析报告

目标:确定项目重点、进行总体分析、总结经验。

结构:标题、目录、前言、正文、结论与建议、附录。

二、材料准备:数据的采集与处理(数据分析的首要任务)

1.认识数据:字段与记录,数据类型、数据表的呈现

2.获取来源:网站数据导入、文本数据导入

3.处理数据:清理、抽样、计算。

三、分析依据:掌握数据分析方法

1.数据透视表的创建与编辑

2.数据分析七大方法

(1)平均分析法

—含义:利用平均指标对社会经济现象进行分析,分为数值平均数、位置平均数(众数、中位数)。

—作用:可以比较同类企业、产品、服务标准之间的本质性差距;分析数据之间相互依存的关系;对企业中的某产品在不同时间上进行水平比较,说明产品的发展趋势和规律。尤其是与对比分析法相结合,发挥的效果最好。

(2)比较分析法

—含义及作用:将客观的事物进行对比认识事物的本质和规律,进而判断优劣。通常是将两个或两个以上的同类数据进行比较,横向比较和纵向比较。纵向比较是对同一事物不同时期的特征进行比较,从而认识事物的过去现在未来;横向比较是对不同地区、时期的同类事物进行比较,找出差距,判断优劣。(比较角度:不同时间、企业内部、比较业绩目标、竞争对手)

(3)漏斗分析法

直观易懂,体现访客在业务中的转化和流失率,例如网站转化率漏斗图。

(4)数据矩阵分析法

可从原始数据中获得许多有益情报,将多个变量化为少数综合变量的多元统计法。(行列、四个象限)

该法可进行多因素分析。复杂质量评价,有利于节约时间、提高分析质量。

(5)交叉分析法

通常用于分析两个变量之间的关系(二维交叉表)

(6)杜邦分析法

该法从企业绩效评价来看,是从财务角度来评价企业盈利能力、股东权益回报水平以及企业绩效的一种经典方法。最显著的特点是将若干个用以评价企业经营效率和财务状况的比率按照其内在联系有机结合起来,形成一个完整的指标体系,最终通过权益、收益率综合反映出来。但杜邦分析法不能全面反映出企业实力,在运用中要和企业其他信息结合进行分析。

(7)分组分析法

在分组的基础上,对数据分析对象的内部结构、现象之间的依存关系,从定性的角度去分析研究,从而认识分析对象的不同特征、性质及相互关系的方法。三种形式:按数量分组、相关关系、品质分组分析法。

四、效果展现:数据图表的可视化

1.数据可视化

(1)个性化呈现:可视化地图、趋势地图、标签云

(2)数据可视化作用:可以使数据多维地展现出来,使数据分析师以交互的方式管理和开发数据,数据可以用图形图像动画展示分析。大大加快数据的处理速度,提高数据的利用,视觉效果好,易观察出规律和现象。

(3)工具:Excel、比萨饼图、Poly Maps、Google chart api、highcharts、R、Gephi

2.数据图表

作用:直观体现数据表达的现象,简洁体现,突出重点、提高专业性。

五、数据图表的转换与美化

转换图表显示效果:双坐标图、平均线图、瀑布图、成对条形图、蛇形图、矩阵图、漏斗图。

六、Access

七、Excel

数据分析库

(1)回归分析(线性预测):确定自变量和因变量;制作散点图,确定回归模型类型;估计参数建立模型;检验模型;进行预测。(回归统计表、方差分析表—5个指标:自由度、误差方和、均方差、F统计量、siginificant F(临界点,0.01和0.05);回归系数表)

(2)指数平滑

改良的加权平均法,借助于平滑系数a

(3)移动平均法

基于过去的均值对未来进行预测,时间序列逐步推移。

(4)描述性统计分析:指标——平均数、方差、标准差、求和、中位数。

(5)抽样分析

(6)相关分析

(7)直方图

八、电商数据分析

1.选择核心数据:会员数据、营销数据、行业数据、交易与服务数据

2.核心指标:会员指标(有价值的、回购、留存、活跃、流失)、流量指标(跳失率、二跳率、浏览量、PV/ip比、访客数、在线时间)、营运指标(采购、成交、退货、效率、库存、供应链)、转化指标(注册转化率、收藏、添加、成交、客服)

3.核心方法:二八法则、排行榜分析法(直接累加、加权求和、多次排名)








评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值