缺失值在统计和数据分析中起着重要作用。通常,不能简单的忽略缺失值,而应该仔细研究它们,以了解是否存在潜在的模式或缺失的原因。
两种缺失值
NA
在R
中,NA
用于表示“不可用”或“缺失”(在统计意义上)的任何值。 在本课程中,我们将进一步探索缺失值的价值。
任何涉及NA
的操作通常都会产生NA
。 为了说明这一点,让我们创建一个向量c(44,NA,5,NA)
并将其分配给变量x
。
> x <- c(44, NA, 5, NA)
看看x * 3
的结果是什么:
> x * 3
[1] 132 NA 15 NA
我们可以看到结果向量里,与NA
对应的元素的值也是NA
。
为了让事情更有趣一些,我们来创建一个向量,该向量包含1000个来自标准正态分布元素: