用excel做数据分析主要分几步:
- 第1步:明确问题
- 第2步:理解数据
- 第3步:清洗数据
- 第4步:数据分析
- 第5步:数据可视化【单独一篇https://zhuanlan.zhihu.com/p/313997258】
第3步:数据清洗步骤【实操数据分析中要花很多时间的,重要的基本工作】
- 选择子集
- 列名重命名
- 删除重复值:选择删除重复项字段,直接进行删除重复项操作
- 缺失值处理:查找定位——缺失值一步填写
- 一致化处理:分列;查找和字符串截取函数
- 数据排序
- 异常值处理:find、count、if函数
常用的函数:
函数的3个功能:
- 功能:函数
- 输入:参数
- 输出:返回值
- 平均值函数 应用:用函数来计算平均值(这个比较常用,基本逻辑和使用比较简单)
- 查找和字符串截取函数
- left函数语法:left(text,num),从左侧开始截取部分字符串,其中:text表示要截取的字符串,num表示要截取的字符数
- right函数语法:right(text,num),从右侧开始截取部分字符
- mid函数语法:mid(text,start,num),中间某位置开始截取部分字符串
- find函数语法:find(“”,text)+1,从该字符串中查找“”,+1-1可代表位置前后
- len函数语法:len(text),该字符串的长度
注意:
- 字符串类型---改为数字类型:复制-黏贴(数字格式)
- num的参数,很多时候不是固定值,而是条件参数,这个时候使用find函数
实操:数据清洗前六步的处理结果
异常值处理应用:职位数据清洗
- 学习find,count,if函数的基本内涵和应用
- 注意:当参数是数据组,需要使用{}
数据透视表的原理:
- 数据分组(split)
- 应用函数(apply)
- 组合结果(combine)
第4步:数据分析
技能:excel的数据分析功能
问题1:去哪个城市工作机会比较多?(数据透视表城市计数+排序)
问题2:发展前途如何?
问题3:薪水高么?
问题4:工作经验不同,薪水是怎样变化的?
————————————————————————————
拓展技能:
日期数据如何处理?
- 分列,YMD:统一日期格式
- 数据透视表:按日汇总,按月+年汇总(创建分组)
- 应用:电商婴儿商品,每年不同月份的商品销量?
- 分析:可以看出2014年的11月份销量远高于其他月份,推测可能是开启了双十一哈哈
多表查询vlookup拓展理解:
第3关问题:Excel分析(多表查询vlookup)