在开始构建MLP模型之前,首先需要对数据进行清洗。这一步骤非常重要,因为它有助于确保数据的质量和准确性。
首先,观察数据集的形状、列名称、前10行数据以及每一列中唯一值的数量。通过这些信息,我们可以了解数据集的概貌,并发现其中的问题。
输出数据集大小
print(“[Boston数据集大小:]\n{} rows and {} columns”.format(dataframe_one.shape[0], dataframe_one.shape[1]))
输出数据集各特征名称
print(“\n[数据集各特征名称]”)
print(dataframe_one.columns)
展示数据集前10行数据
print(“\n[数据集前10行数据]”)
print(dataframe_one.head(10))
显示每一列中唯一值的数量
print(“[每一列的唯一值]\n”)
print(dataframe_one.nunique())
接下来,我们需要处理缺失值。在本文中,我们将介绍如何找到缺失值并进行填充。此外,我们还将演示如何四舍五入数字数据以提高数据的可读性(本实验不需要四舍五入数字数据)。
print(“\n[缺失值填充前]------缺失值总数为{}”.format(dataframe_o