学习笔记之第一章数据分析基础(一)

数据分析通过统计学和业务理解揭示企业运营现状、原因和预测。它涉及总体概览、对比、集中趋势、离散程度、相关性等指标的分析,以及异常、重复、缺失数据的处理。数据分析流程包括明确目标、获取和熟悉数据、处理数据、得出结论并验证,常用工具如Excel和Python。
摘要由CSDN通过智能技术生成

1.1 数据分析是什么

  • 数据分析是指利用合适的工具在统计学理论的支撑下,对数据进行一定程度的预处理,然后结合具体业务分析数据,帮助相关业务部门监控、定位、分析、解决问题,从而帮助企业高效决策,提高经营效率,发现业务机会点,让企业获得持续竞争的优势。

1.2 为什么要做数据分析

1.2.1 现状分析

  • 第一,告诉你现阶段的整体运营情况,通过各个关键指标的表现情况来衡量企业的运营状况,掌握企业目前的发展趋势。
  • 第二,告诉你企业各项业务的构成,通常公司的业务并不是单一的,而是由很多分支业务构成的,通过现状分析可以让你了解企业各项分支业务的发展及变动情况,对企业运营状况有更深入的了解。

1.2.2 原因分析

1.2.3 预测分析

1.3 数据分析究竟在分析什么

1.3.1 总体概览指标

  • 总体概览指标又称统计绝对数,是反映某一数据指标的整体规模大小,总量多少的指标。
  • 经常关注的总体概览指标称为关键性指标

1.3.2 对比性指标

  • 同比是指相邻时间段内某一共同时间点上指标的对比,环比就是相邻时间段内指标的对比;

1.3.3 集中趋势指标

  • 集中趋势指标是用来反映某一现象在一定时间段内所达到的一般水平,通常用平均指标来表示。平均指标分为数值平均和位置平均。
  • 数值平均是统计数列中所有数值平均的结果,有普通平均数和加权平均数两种
  • 位置平均是基于某个特殊位置上的数或者普遍出现的数,即用出现次数最多的数值来作为这一系列数值的整体一般水平。基于位置的指标最常用的就是中位数,基于出现次数最多的指标就是众数。

1.3.4 离散程度指标

  • 离散程度指标是用来表示总体分布的离散(波动)情况的指标,如果这个指标较大,则说明数据波动比较大,反之则说明数据相对比较稳定。

1.3.5 相关性指标

  • 相关系数r的范围为[-1,1]。
  • r的绝对值越大,表示相关性越强。
  • r的正负代表相关性的方向,正代表正相关,负代表负相关。

1.3.6 相关关系与因果关系

1.4 数据分析的常规流程

1.4.1 熟悉工具

1.4.2 明确目的

1.4.3 获取数据

1.4.4 熟悉数据

1.4.5 处理数据

● 异常数据。● 重复数据。● 缺失数据。● 测试数据。

1.4.7 得出结论

1.4.8 验证结论

1.4.9 展示结论

1.5 数据分析工具:Excel与Python

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值