为一名合格的数据分析师或者说一名称职的数据挖掘领域从业者,大家肯定都耳熟能详的认为其必须具有如下基本技能:
** 一、熟练的掌握SQL、Hive等; **
** 二、R、SAS、Python等至少精通其中一种。 **
但往往大家忽视了最基本的技能要求:使用Excle进行数据处理与数据分析的能力。大家可以仔细回想下自己公司里面,excel玩的很6的人绝对不是数据部门的人,而往往是业务部门或财务部门的同事。Excel作为数据分析工具,可以分为两大部分,一是Excel的数据处理能力,一是Excle的高级数据分析能力。在小数据量下(注:大数据量下会存在处理效率的问题),Excel完全可以像R、SAS等统计软件进行假设检验、相关分析、回归分析等数据分析与数据建模工作,这就是Excel的高级数据分析功能。本文作为Excel使用介绍的开篇,先和大家一起分享Excel的高级数据处理方法。
一
** 利用Vlookup函数进行数据查找 **
在分享这个函数前,我们先来思考如下一个案例:
** 【案例1.1 】 ** 假设所得税的税率如下图1.1区域所示。其中的含义是:
0~500的税率为0%,
500~1000的税率为1%,
1000~1500的税率为3%
……,4000以上的税率为20%
问题:根据职工收入如何快速计算每位职工应缴的所得税?
图1.1 工资所得税计算
计算所得税的关键就在于根据收入找到其对应的所得税率。肯定有同学会说,这个简单,直接使用if函数就可以很方便的解决。诚然,if函数确实可以解决这个问题,但实际操作起来的时候,你会发现需要嵌套多个if函数方可。如果分段较多的话,if函数进行操作很不方便,因为很可能到最后你都不记得到底嵌套了多少层if函数。对于这个问题,Vlookup函数可以快速便捷的解决。
** Vlookup函数讲解 **
** 功能 ** ** **
V lookup按 列查找 的方式从指定数据表区域的 最左列 查找特定数据,它能够返回查找区域中与找到单元格位于 相同行不同列 的单元格内容
。
** 格式 ** ** **
Vlookup (x, table, n, f)
其中,x是要查找的值;table是一个单元格区域;n中table区域中要返回的数据所在列的序号。n=1时,返回 table 第1列中的数值;n=2时,返回
table 第2列中的数值;以此类推。f是一个逻辑值,表示查找的方式。 当其为 true(或1) 时,表示 模糊 查找;当它为 false(或0)
时,表示 精确 查找。
**
**
** 说明 **
Vlookup函数在table区域的第1列中查找值为x的数值,如果找到,就返回与找到数据同行第n列单元格中的数据。当f为true时,table的第1列数据必须按升序排列,否则找不到正确的结果;当f为false时,table的第1列数据不需要排序。
**
**
** 注意 **
①如果Vlookup函数找不到x,且f=true,则返回小于等于x的最大值。
②如果x小于table第1列中的最小值,Vlookup函数返回错误值“#N/A”。
③如果Vlookup函数找不到x且f=FALSE,Vlookup函数返回错误值“#N/A”。
案例讲解
** (1)用Vlookup进行模糊查找 **
前面一开头提出的计算所得税那个问题,就可以使用Vlookup的模糊查找进行完美解决(具体方法见图1.2)。
图1.2 Vlookup进行模糊查找
** (2)用Vlookup进行精确查找 **
精确查找就是指查找数据完全匹配的查找,Vlookup函数具有此项功能。在大表中查找特定数据,或查找不同工作表中的数据,特别是工作表数据较多,
Vlookup函数显得非常有效。
【 案例1.2
】某校某专业期末考试的数据库成绩表如图的A:H列所示。由于人数较多,要查看某个同学的成绩非常困难。希望能按学号进行查找,即在K5输入某个学号后,就能自动显示出该学号所对应的姓名和各种成绩,如图1.3的J4:M16所示。
图1.3 个人成绩查询
** 案例解决方法如下: ** ** **
(1)在M5中输入公式:=VLOOKUP(K5,A5:H227,2,0)
(2)在L6中输入公式:=VLOOKUP(K5,A5:H227,3,0)
(3)在L7中输入公式:=VLOOKUP(K5,A5:H227,4,0)
(4)在L9中输入公式:=VLOOKUP(K5,A5:H227,5,0)
(5)在L11中输入公式:=VLOOKUP(K5,A5:H227,6,0)
(6)在L13中输入公式: =VLOOKUP(K5,A5:H227,7,0)
(7)在L15中输入公式: