一、数据处理的内容
数据处理的内容主要有以下两项:
1.数据清洗。将多余重复的数据筛选出来,并剔除;将缺失的数据补足,将错误的数据纠正或删除。
2.数据加工。对清洗过后的数据进行字段的信息提取、计算、分组、转换等处理。
二、数据清洗
1.重复数据的处理
![](https://i-blog.csdnimg.cn/blog_migrate/d6bb4d1095d52e90dd209cab1d2074cc.png)
第一步,找出重复数据。
方法1:函数法
COUNTIF(range,criteria),对区域中满足单个指定条件的单元格进行计数。
- range:要计数的单元格范围。
- criteria:计算条件,可以为数字、表达式或文本,如32、>32或“三十二”。
在B2单元格输入=COUNTIF(A:A,A2)
,计算每一个员工编号出现的次数。
在C2单元格输入=COUNTIF(A$2:A2,A2)
,计算出现了两次及以上的重复项。以C9对应的编号为例,3表示从A1~A9,该编号是第3次出现。
方法2:高级筛选法
方法3:条件格式法
方法4:数据透视表
用数据透视表统计各项数据出现的频次,出现2次及以上为重复项。
第二步,删除重复数据。
方法1:通过菜单操作删除重复值
方法2:通过排序删除重复值
选择筛选功能,升序排序C列数据,删除大于1的数值即可。
方法3:通过筛选删除重复值
直接将筛选出来的重复值删除即可。