为什么要清理数据? 清理 主要是去 删除! 比如:要用机器学习实现一个小功能,识别出 猫和狗。但是如果输入学习的材料中有很多人抱着狗(👤&🐶),人遛狗(🚶♂️&🐕)的图像,那么会引导系统学习出一个结论,人=狗🐕。估计下次 看到人🕴的图像,就是识别出 这就是 🐕。 所以,这就需要数据清理。 数据清理 是 数据预处理的一个步骤。 先介绍一下 数据清洗:脏数据过滤。 :删除无效值(拼写错误和内容不合法)和空数据; :删除重复数据 到此结束!