数据分析(新手向)
为了准备一个比赛,所以决定花一天时间学习一下数据分析基础,内容不会学的太深,因为目前还用不太到
1 基本流程
先说一下需求分析,其他的后面会提到
需求分析其实就是列举出和数据的走向(上升或下降)相关的因素,通俗来说就是哪些值的改变会影响要研究数据的改变,先把这些值列举出来.
2 数据整理
数据异常表现:
空值
波动太大
不同数据源获取的数据矛盾
数据异常原因:
系统故障
人为因素
数据如何清洗:
删除异常值
平均值填充
通过统计计算值填充
不同数据源的数据及交叉验证
横向拆解数据指标原则:
应遵循MECE原则,也就是相互独立,完全穷尽
同一类型的数据在同一层级
纵向拆解数据的原则
拆解的时候最多选择一条住流程
主流程应该选择大多数用户的操作流程
3 数据分析方法
(1) 对比分析法(时间对比,空间对比)
eg:同一个数据不同城市的对比
(2) 分组分析法
用于数据包含的信息多样化,同时各种类型的数据之间差异较大,用于分析不同类型数据之间的差异
eg:按照时间和娱乐方式分组,然后分别对时间(年,月,日)和娱乐方式(看视频,出去旅游等)内部用图表进行分析。
(3) 逻辑树分析法
分层罗列影响因素,发现问题
(4) 漏斗分析法
用于某个行为路径中的问题
4 Excel 处理数据
4.1 数据拆分
4.2 数据合并
按图的步骤,点击函数(我还没导入数据,只是步骤示意)
选择合并函数,可以在搜索框里搜中文就可
text1和text2就是你要合并的列
注意:日期可以直接选函数里的data
4.3 数据清洗
数据填充
先选中需要填充的列,然后按Ctrl+G会出来定位框
点击定位条件,选择你所需要的定位条件
在其中一个空值处,输入你想填充的数据,批量填充按Ctrl + alt
处理重复值
点击之后,重复的
数据转换
这里讲一下转换成日期的计算,同样选分列,点击日期,分割选在最后一个数字之后即转换成功,装换之后就就可以进行日期计算了。
4.4 数据计算
简单计算:加减乘除符号、sum函数、Average函数
日期计算:Datedif函数
注意: 这个在函数里找不到,需要直接输入
EG:2009/11/1到2018/8/22,算工龄(年、月)
数据分组:Vloolup函数
加权计算:Sumproduct函数(选中每一个指标的值和每个的权重,可以计算综合得分)
(关于数据可视化我会单独写一个博客的,这里就不说啦)