系列文章目录
第一章 Excel 数据分析之 系统认识数据分析框架
随着人工智能的不断发展,数据分析这门技术也越来越重要,很多人都开启了学习数据分析,本文就介绍了Excel数据分析学习的基础内容。本章简单通过Excel来系统认识数据分析框架,详细请看下文。
目录
前言
本章简单通过Excel来系统认识数据分析框架,详细请看下文。
提示:以下是本篇文章正文内容,下面案例可供参考
一、数据分析是什么?
数据分析的全貌包括观测、实验和应用。
二、观测
1.观察
观察:采集数据、储存数据、展示数据
1.1 采集数据
(1)解析系统日志
(2)埋点获取新数据
基于系统日志新增数据的过程,称为”埋点“。
埋点是分析师获取新数据的主要方式,也是最可控最可靠的方式。
(3)通过传感器采集
(4)爬虫
解析别人埋点获取的数据,爬虫相当于偷袭别人的劳动成果。
!!正规企业不会把爬虫作为获取数据的主要手段 !!
(5)API application programming interface 应用程序接口
按照规则提供数据,只要告诉他要什么数据,能提供的都可以提供。
api获取需要填写代码, 只需要获取代码的地址和参数。
1.2 储存数据
(1)将数据储存在各种类型的数据库中
数据采集结束后需要存储到数据库里。(❌下载之后存到本地文件夹❌)
常用的数据库种类:
数据工程师,对数据进行清洗、计算等等,得到大家需要的数据。
(2)连接数据库进行取数
获取数据后要展示数据,常用报表、图表与表盘。
1.3 展示数据
可视化高效传达信息(又叫 数据可视化)
数据库帮助自动提取数据,展示最新的可视化结果(需要excel和tabelai)
2.测量和分析
测量和分析: 设定标准、发现异常、研究关系
2.1 分析数据的目的
(1)及时发现异常,事情没有按照预期发展,需要及时查找问题数据、指导解决问题。
(2)找到数据之间的因果关系,数据指导业务越做越好。
2.2 数据的客观统一性
数据是客观统一的。有统一的认知才能有共同的目标。
2.3 数据的benchmark
在经典咨询场景,数据标准被称为“benchmark”,进行分析判断的重要标准。
2.4 研究关系
可视化查看相关性;建模推导相关性。
三、实验
1.提出假设,然后验证假设
提出一个合理的假设,对疑问进行解释。
恶劣天气确实会导致外卖商家差评率飙升。虽然显而易见,但是要牢记:
!!所有未经实事数据验证的想法都是假设 !!
2.设计A/B测试获取数据
在不知道哪个版本更好的情况下,设计A/B测试获取数据。
(如:在产品没有完全上线之前,把产品最主要的特征做出来,一小部分的用户验证。 )
几个问题:
如何在业务只有少量数据时设计数据实验?(样本不够)
如何在无法同时测试两个版本时比较数据?(业务场景无法同时做两个版本,产品A/B测试)
四、应用
1.基于数据反馈不断迭代产品和业务策略
流程:借助bi平台可以自动提取数据知识,让业务看见数据发现异常、研究关系。
2.基于数据训练算法,让机器自动化地完成工作
做业务分析一定明确业务目标,然后拆解目标,即业务每个阶段要做成什么样?
3. 目标拆解方法
3.1 目标拆解方法
杜邦分析法:
基本思想是将企业净资产收益率逐级分解为多项财务比率乘积,这样有助于深入分析比较企业经营业绩。由于这种分析方法最早由美国杜邦公司使用,故名杜邦分析法。
PEST:
政策(Political):政府对行业监管政策
经济(Economic):宏观经济形势
社会(Social):社会发展趋势
技术(Technological):新技术出现
RFM:
R Recency:最近一次消费至今的时间
F Frequency:一定时间内重复消费频率
M:一定时间内累计消费金额
RFM的缺点是很明显的:它仅仅考虑了用户的行为数量,没有考虑用户在干什么。
比如用RFM考察用户消费,就少了一个关键内容:用户买的是啥。
3.2 把数据应用与业务
3.3 把数据应用于算法
设定目标是算法的前提条件。
让算法推荐用户喜欢看的视频(❌算法让用户开心❌)
算法是否创造了业务价值并不清楚,只能看到算法的完成率、准确率、错误率。
一家优秀的互联网公司必要条件:
训练算法让机器自动化完成工作。基于用户的行为数据,为用户提供感兴趣的内容。
谁的算法更加精准,谁的用户更多。
!!!!!!!!!!!!!!!!!!!!
应用数据更好的训练算法,是未来职场内的必备技能。
要基于数据优化业务或基于数据优化算法,有自己的无可替代性。
总结
提示:这里对文章进行总结:
随着人工智能的不断发展,数据分析这门技术也越来越重要,很多人都开启了学习数据分析,本文就介绍了Excel数据分析学习的基础内容。本章简单通过Excel来系统认识数据分析框架,详细请看下文。