1. 数据清洗目的:
- 需要根据学校把专业表里对应层次修复为目标层次;
- 层次为空时默认修改为高职;
- 不同学校修复的规则不一样;
部分数据如下截图:
2.修复数据
需求:根据不同学校不同的规则把专业表里的LEVEL_NAME 替换成新的level_name;
解决方案思路及步骤:
四百多个学校,每个学校的规则(即中专是替换成高职还是中技)不统一,不可能按照学校来处理,这样最少要处理400次;
根据Excel里的每一条数据来做处理,只需要判断每条数据里的两个字段(school_name和level_name)来决定替换的新level_name
的值
***清洗:**level_name为空的数据会通过数据修复补齐所以,where level_name is null EXCEL里的一行数据就要删掉;
***清洗工具:Excel
清洗步骤