数据清洗 Data Cleaning
文章平均质量分 93
掌握高效的工作流程,对现实世界的杂乱数据进行清洗处理。
AI算法蒋同学
信息学奥赛教练!从事AI视觉检测、AI数据智能相关产品研发工作!
展开
-
5、不一致的数据录入
有效地修复数据中的拼写错误。“Inconsistent Data Entry”(不一致的数据录入)是指在进行数据录入时,由于各种原因(如字母大小写不一致、多余的空格、输入错误或表达问题等)导致输入的数据与实际数据不一致的情况。例如,输入的数据可能本来是一个东西,但是由于字母大小不一致,或者多个空格,或者由于输入问题,或者表达问题,导致一个单词有相似的表达方法,致统计出来的数据是多个。在这个笔记本中,我们将学习如何清理不一致的文本条目。让我们开始吧!原创 2024-01-27 14:13:45 · 688 阅读 · 0 评论 -
4、字符编码.md
在这节课中,我们将处理不同的字符编码。原创 2024-01-26 10:59:23 · 124 阅读 · 0 评论 -
3、日期解析
这节课我们研究一下日期类型的解析和处理!原创 2024-01-26 10:58:14 · 1093 阅读 · 0 评论 -
2、数据缩放和标准化
我们将探讨如何缩放和标准化数据(以及这两者之间的区别)。让我们开始吧!设置我们的环境 我们需要做的第一件事就是加载我们将要使用的库。原创 2024-01-25 09:09:01 · 1213 阅读 · 0 评论 -
1、缺失值处理
数据清理是数据科学的关键部分,但它可能会让人深感沮丧。为什么你的一些文本字段会乱码?你应该如何处理那些缺失的值?为什么你的日期格式不正确?你如何快速清理不一致的数据输入?在这门课程中,你将了解为什么会遇到这些问题,更重要的是,你将学习如何解决这些问题!原创 2024-01-25 09:05:19 · 1227 阅读 · 0 评论