目录
一、什么是数据分析
大数据时代,我们身边的所有信息,身高体重、什么时候打开淘宝、什么时候吃饭睡觉,喜欢吃什么外卖都是数据。
而数据分析的基础,就是收集数据。
我们平时工作中经常需要做的日报、周报、月报,就是在收集我们平时的工作数据,还有薪酬统计表,出入库登记表,销售业绩表等等。
在我们日常工作中可能要跟很多的表格去打交道,如个人业绩表、日周月报总结、个人项目报表等等,但是我们制作的表格大多可能都是不规范的,很多人也不重视做表这一环节。
但往往最容易忽视的地方往往也是最重要的地方!
做表的过程其实就是一个数据采集的过程!!但是真正有多少人认真审视过公司给的表格登记模板呢?
可以说60%以上的人目前用来收集数据的表格,是不规范的。要么是公司的看板,填数字的那种。后续进行数据分析的难度很大。
我们大家可以审视一下实际工作中的表格是不是这样的,这样表格是没办法进行深入的分析,虽然看起来好像有点直观,实际上一点也不直观,特别是数据量多了以后。
数据分析,我们可以拆解为两部分,数据+分析。
以分析为骨,数据为肉,这样才能有理有据组织报告。
分析是骨架(主),数据是血肉(附),有骨有肉才能组成一条龙。
但我们常见的数据确实:
-只有数据:机器报表不香吗?
-只有分析:你是瞎猜的吧?
分析在里面更多是一个骨架,是一个思考的框架。
数据就是骨架上的肉,你要用数据,用血肉填填充工作汇报的,它才是一个有血有肉的这样的一条龙,它才有意义。
有朋友说我只想学PPT,不需要学Excel,不需要学数据分析。
那么我请问,你PPT里汇报的都是什么?
如果你是领导,你会怎么看这样的汇报?
所以数据分析,是集数据收集、数据分析、数据汇报三者相结合,缺一不可。
数据分析是为了提取有用信息和形成结论而对数据加以研究的的过程。
收集与处理数据——分析数据、发掘信息——诊断信息、形成结论——结论影响决策。
敏锐数据洞察 | 协助老板诊断+解决问题 |
生动的数据汇报 | 更强力说服老板 |
高效的处理数据能力 | 更快的完成老板的任务 |
我们的学习目标:
1、掌握三个技能点:高效处理+生动汇报+业务诊断。
2、重视数据能力,持续的思考如何帮到自己的只有发展。
二、数据处理【清洗与加工】
数据处理是最费时间的环节。
如果我们把整个过程比喻成一次做菜的话。
数据处理就是我们买菜洗菜切菜(备菜环节);
在我们进行数据处理时,首先我们要对数据进行清洗。
数据清洗:解决数据分析拦路虎
数据脏乱(杂乱、重复、无效) | 数据分散(数据源过多) | 数据残缺(缺数据、缺指标) |
数据整理 | 数据整合 | 数据计算 |
危险误区:轻视数据清洗处理!
70%的错误分析结论,源于错误不规范的数据清洗;
数据处理通常占整个分析70%-80%的时间,效率不高特别浪费时间。
那如何提升数据处理效率和准确性呢?
普通量级数据(Excel) | 大型数据源(10w+条) |
建立清晰的分析思路 | MySQL:直连数据库查询 |
Excel操作:完成单表基本处理 | Python:特殊分析需求编程实现 |
Excel基础函数:单表快速运算 | Hadoop等大数据技术 |
Excel进阶函数:完成跨表处理 | 综合的自动化办公软件 |
PowerBI:高级跨表加工 | |
宏及VBA:实现简单自动化办公 |
菜鸟与高手的差距就是对于函数的掌握!
三、Excel函数使用【组合函数】
光说不练假把式,简单出一个例题——快速计算年终奖。
首先要说到第一个函数。
1、合并函数【CONCATENATE】
我们使用CONCATENATE(B8,C8)
就可以将天猫客服 和 1 合并成 天猫客服1;
我们同样可以使用 B8&C8 达到这样的效果。
注释:&在这里表示“和”的意思
2、分列功能【数据分列】
我们首先全选要分列的内容;进行复制,再新创一个表格,去进行分列操作。
点击【数据】——【分列】;
会出现以下引导步骤
我们根据自己文档内容去选择如何进行分列,因为此时我们的分割符号很详细,所以我选择的是以【分割符号】去进行分列。
点击下一步;
分割符号如果没有,我们需要在其他中进行补充,分号要注意中英文格式,直到数据预览中出现我们想要分列格式。
我们不需要的内容可以在数据预览中点击那一列,选择不导入此列。
此时就完成了我们的分列操作。
3、提取函数【RIGHTB】
在提取时,我们要注意,这里边涉及到一个字符的概念。
因为我们提取的是汉字,【一个汉字是两个字符!】
字符串我们一般选择要进行数据提取的那一个表格,如同是D8;
字节个数由于我们要提取的是男,所以字节个数是2;
最后会有一个计算结果,如果计算结果是我们预期要的值,点击确定即可。
4、日期计算函数【DATADIF】
这个函数涉及到三个数据:开始日期、终止日期、比较单位。
开始日期我们选择表格内容,即F8
终止日期是2019-12-31,此时我们要注意,一定要用英文格式下的双引号将日期括起来。
比较单位:所需信息的返回类型 "Y"代表年、"M"代表月、"D"代表天
最后我们得出一个数据:7,代表的意思就是7年的工龄。
5、跨表格函数【VLOOKUP】
在跨表格函数里涉及四个值:查找值、数据表、列序数、匹配条件。
查找值:因为我们要查找的是天猫客服1的业绩,所有我们的查找目标就是天猫客户1
数据表:则对应我们表2源数据-财务表中的两列数据(注意:我们的数据表应该选择的是全部数据)
列序数:由于我们所需要的业绩位于我们数据表中的第二列,所有我们列序数是2
匹配条件:指定我们在查找时是精确查找还是大致匹配。如果为FALSE,则是精确查找;如果是TRUE或忽略,则为大致匹配。
6、求和函数【SUMIF】
我们对满足条件的单元格求和使用SUMIF函数
这里涉及三个参数:区域、条件、求和区域。
区域:我们要从那个数值中取得我们的数据。因为此时我们要算的是客服的订单总金额,所有我们要选择的区域就是成交客服这一列
条件:此时我们要查的是成交客服中的天猫客服1,所以此时的条件就是天猫客服1
求和区域:我们此时要算的是客服的订单总金额,所有我们的求和区域就是订单金额这一列
7、排序函数【RANK】
在排序函数中也有三个参数:数值、引用、排位方式。
数值:我们此时要算的是天猫客服1的业绩,所以我们的数值就是天猫客服1(K8)。
引用:我们要算的是天猫客服1的业绩在所有人的业绩里面排名第几,所以我们的引用就是所有的参考业绩(K8:K32)
此时要注意这里有相对引用和绝对引用之分。
K8:K32是相对引用;
K¥8:K¥32是绝对引用;
两者区别在于相对引用是从选择的第一个值到最后,如果选择的第一个值是K8,它代表从第8行到32行;如果选择的第一个值是K30,它代表从第30行到第32行。而绝对引用K$8:K$32,无论是第几个数值,它都是从第8行到第32行,不会因选择的数值的位而改动。
我们一般使用的是绝对引用
排位方式:如果为0或忽略,则为降序;如果为非零值,则为升序。
8、判断函数【IF】
IF函数中也有三个参数:测试条件、真值、假值。
测试条件:我们进行测试的是排位是否是前十,所以我们看使用排名的值是否小于11去进行判断。即:M8<11
真值:由于我们前十名每人奖励1000,所以真值为1000;
假值:当然十名以后的没有奖励,所有假值为0
9、多层判断函数【IF嵌套】
这里我们根据要求
测试条件:当我们的目标完成度超过100%,提点为1%,所以我们的测试条件是L8>100%
真值:按照要求,超过100%,提点1%,所有真值是1%。
假值:假值这里又牵扯到目标完成度超过80%,提点为0.5%,所有我们这里的假值需要再使用一个IF语句。即IF(L8>80%,0.5%,0)
括号中,第一个L8>80%为测试条件,“,”后面跟的分别是真值和假值。即真值为0.5,假值为0.
10、快速填充【Ctrl+Enter】
当我们需要打印重复东西时候,只需要选择需要重复的区域,将鼠标定位再点击好好学习(红框标识的位置),按Ctrl+Enter即可
11、日期加工函数【WEEKNUM、WEEKDAY】
WEEKNUM 代表(第几周)
WEEKDAY 代表(周几)
12、拼音加工函数【PROPER】
13、跨行文本合并函数【PHONETIO】
14、快速抽签分组函数【RANDBET】
15、多变量交叉查询函数【SUMPRODUCT】
=SUMPRODUCT((K$7:K$15=D7)*(L$7:L$15=F7),M$7:M$15)&"元"
如果员工肖战的部门绩效A(D7)属于部门绩效中的一项 即(K$7:K$15=D7)
如果员工肖战的个人绩效A(F7)属于个人绩效中的一项 即(L$7:L$15=F7)
员工肖战的部门绩效和个人绩效进行匹配 即(K$7:K$15=D7)*(L$7:L$15=F7)
匹配上的奖金从奖金项中选择 即M$7:M$15
16、评分变星函数【REPT】
函数使用的好坏决定了我们数据清洗的速度,当然列举的仅仅只是部分函数。
如果你对数据分析感兴趣,对于Excel函数的学习,可要加把劲了!
觉得写的不错的朋友可以点赞、收藏、评论一波!