使用可用特征的均值来填补缺失值;使用特殊值来填补缺失值,如-1;忽略有缺失值的样本;使用相似样本的均值添补缺失值;使用另外的机器学习算法预测缺失值。 如果在测试数据集中发现了一条数据的类别标签已经缺失,那么我们的简单做法是将该条数据丢弃。 这是因为类别标签与特征不同,很难确定采用某个合适的值来替换。