Excel数据分析学习笔记(五)数据的清洗和加工

**

第四章 数据的清洗和加工

**
**

1,数据清洗

**
目的:将多余的、错误的数据清洗出去,留下有价值的数据。

1)删除重复项的方法:
① 单击【数据】选项卡下【数据工具】组中的【删除重复值】,设置删除列。
② 根据人名排序,找到重复值,进行人工排查是否重名,然后进行删除。
③ 选中某一列数据,选择【开始】选项卡下【条件格式】下拉菜单当中的【突出显示单元格规则】选项,再选择【重复值】选项。

2)处理默认值的方法
① 找出默认值。大多数情况下默认的数据会以空白单元格显示。使用【Ctrl+G】组合键打开【定位】对话框,单击【定位条件】。设置定位条件时选中【空值】按钮,然后查看结果。
② 处理默认值:
替换。可以用平均数、回归分析之后的数据模型,还可以通过查找其他资料将其补上。
删除。当样本充足时可以删除包括默认值在内的一组数据。
忽略。当样本量足够大时还可以选择忽略默认值。
③ 深度检查数据逻辑
使用IF函数进行检查,其语法为IF(logical_test, value_if_true,value_if_false)
使用条件格式进行检查。可以判断数据是否处于某一正常区间内。选择一定的区域,【开始】选项卡当中的【条件格式】下拉菜单当中的【突出显示单元格规则】,再选择联级选项当中的【大于】选项。
⚠️注意
不要忘记检查格式!!!
检查格式的方法:在【开始】选项卡下【数字】中对选中的数据进行查看,必要时打开【设置单元格格式】,调整数据格式。

**

2,数据加工

**
目的:数据加工可以增加数据表的信息量,改变数据表的表现形式,以激发更多的数据分析思路,发现更多有价值的数据信息。

1)数据计算
使用常用的函数,计算项目的乘积、和、平均数、众数、中位数。
对函数的命名方法要熟悉,例如A1单元格到B6单元格区域的命名方法是“A1:B6”。Excel的【公式】选项卡提供了常用函数的快捷插入。
对于一些不常见的函数,打开【插入函数】对话框,可以根据函数类型进行查找,确定公式类型之后根据对函数的描述来确定是否是自己想要的函数;如果无法确定所需要的函数需要哪个类型,输入到函数描述,单击【转到】按钮,根据推荐函数描述确定是否为所需要的函数。

2)数据转换
① 行列转换,可以使用【选择性粘贴】当中的【转置】
② 记录方式转换:分析数据规律—>选择目标形式—>思考:不符合形式的数据应该如何改进—>找到替换的方法
③ 按【Ctrl+H】组合键打开【查找和替换】窗格

3)数据分类
通过一定的标准将项目归到不同的组别,从而判断数据的表现状况。使用VLOOKUP函数,该函数是一个纵向查找的函数可以用来返回数据所在分组的名称。
该函数的语法是VLOOKUP(要查找的值,要查找的数据表区域,返回数据在查找区域的第几列数据,模糊匹配或精确匹配)
有时会在要查找的列表区域输入 表 示 绝 对 引 用 , ( 格 式 : 表示绝对引用,(格式: $E 3 : 3: 3:$F$6)以保证在向下拖动复制公式时该区域保持不变。

拓展阅读:
https://m.toutiao.com/is/dxMeKmL/ 它才Excel函数中的NO.1,vlookup函数十大用法详解,高效完成工作

4)数据重组
① 拆分:使用Excel中的【分列】功能。
② 合并:v& 逻辑连接词,表示让数据合并显示,例如A4&B4
TEXT 将数据转化为文本格式
CONCATENATE 将单元格数据内容合并显示文本
③ 数据抽取
从一列当中抽取部分数据:使用LEFT函数,从文本字符串的左边开始,返回指定个数的字符。或者使用RIGHT函数,表示从字符串的右边开始截取指定个数的字符。
从多列当中抽取部分列:可以使用vlookup函数

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值