- 博客(1)
- 收藏
- 关注
原创 数据预处理
数据预处理检测并处理数据中的缺失值,可以通过填充、删除或插值等方式进行处理。A:为输入数组,可以是向量、矩阵或多维数组等。TF :为输出的逻辑数组,指示数组或表中的哪些元素包含缺失值。 TF 的大小与 A的大小相同。‘1’代表缺失值,‘0’则不是。如果某个变量或某个样本缺失了 70%以上的数据,那么此时对数据进行填补的话会引入更多的噪声,反而会降低模型的性能,故此时一般直接将该变量或样本删除;如果缺失的不多,我们可以考虑对缺失值进行填补。样本缺失了 70%以上的数据。
2023-08-03 13:33:58
278
2
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人