文章目录 一、EDA 目的 二、代码 一、EDA 目的 EDA的价值主要在于熟悉数据集,了解数据集,对数据集进行验证来确定所获得数据集可以用于接下来的机器学习或者深度学习使用。 当了解了数据集之后我们下一步就是要去了解变量间的相互关系以及变量与预测值之间的存在关系。 引导数据科学从业者进行数据处理以及特征工程的步骤,使数据集的结构和特征集让接下来的预测问题更加可靠。 二、代码 # 2)查看skewness and kurtosis sns.distplot(Train_data['label']); print("Skewness: %f"