了解您需要了解的有关探索性数据分析的所有信息,探索性数据分析是一种用于分析和汇总数据集的方法
一、什么是探索性数据分析?
数据科学家使用探索性数据分析 (Exploratory Data Analysis) 来分析和调查数据集并总结其主要特征,通常采用数据可视化方法。它有助于确定如何最好地操纵数据源以获得所需的答案,从而使数据科学家更容易发现模式、发现异常、检验假设或检查假设。
EDA 主要用于查看在正式建模或假设检验任务之外可以揭示哪些数据,并提供对数据集变量及其之间关系的更好理解。它还可以帮助确定您正在考虑用于数据分析的统计技术是否合适。EDA 技术最初由美国数学家 John Tukey 在 1970 年代开发,在今天的数据发现过程中仍然是一种广泛使用的方法。
二、为什么探索性数据分析在数据科学中很重要?
EDA 的主要目的是帮助在做出任何假设之前查看数据。它可以帮助识别明显的错误,更好地理解