数据就是对事物的描述和记录
1、数据类型
定类数据(例如:性别)、定序数据(例如:春夏秋冬)
2、统计指标
集中趋势:平均、众数、中位数
离散趋势:极差、平均差、标准差
相对、比例、比率、倍数
环比:(这个月-上个月)/上个月、
同比:(这个月-去年这个月)/(去年这个月)
分布形态:左偏、右偏、正态分布
3、异常值
定义:与平均值偏差较大的数值,也叫离群点
识别异常值:利用倍数检测法,该数值/平均值
错误数据处理:填空值、或平均值,只要保证不影响数据就行。数值*(1+调整率)
4、数据分析流程
- 目标确定:明确解决什么问题,或者要达到什么目的
- 数据获取:先确定要选择哪些关键的字段,然后通过SQL从数据库提取
- 数据清洗:异常值、空值、重复值、无效值
- 数据整理:格式化、日期处理、指标计算(如平均值、总额)
- 描述分析:对数据的基本情况进行描述(数据总数、时间维度、数据来源)、然后分析数据指标(变化、分布、对比、预测等情况)
- 洞察结论:数据报告的核心、体验数据分析能力
- 撰写报告:报告背景(业务现状)、报告目的(解决什么问题)、数据基本情况(数据可信度)、可视化图表(数据可理解程度)