R语言：na.fail和na.omit

最新推荐文章于 2023-12-28 16:14:07 发布

满腹的小不甘

最新推荐文章于 2023-12-28 16:14:07 发布

阅读量2w

点赞数 14

分类专栏： R语言文章标签： R语言

R语言专栏收录该内容

16 篇文章 38 订阅

订阅专栏

实际工作中，数据集很少是完整的，许多情况下样本中都会包括若干缺失值NA，这在进行数据分析和挖掘时比较麻烦。
R语言通过na.fail和na.omit可以很好地处理样本中的缺失值。

na.fail（<向量a>）: 如果向量a内包括至少1个NA，则返回错误；如果不包括任何NA，则返回原有向量a
na.omit（<向量a>）: 返回删除NA后的向量a
attr（ na.omit（<向量a>） ,”na.action”）: 返回向量a中元素为NA的下标
is.na：判断向量内的元素是否为NA

example：

data<-c(1,2,NA,2,4,2,10,NA,9)
data.na.omit<-na.omit(data)
data.na.omit
[1] 1 2 2 4 2 10 9
attr(,"na.action")
[1] 3 8
attr(,"class")
[1] "omit"

attr(data.na.omit,"na.action")
[1] 3 8
attr(,"class")
[1] "omit"

另外还可以使用!x方式方便地删除NA。例如：

a<-c(1,2,3,NA,NA,2,NA,5)

a[!is.na(a)]

[1] 1 2 3 2 5

其中，is.na用于判断向量内的元素是否为NA，返回结果：c(FALSE,FALSE,FALSE,TRUE,TRUE,FALSE,TRUE,FALSE)，即a内元素为NA，其对应的下标元素是TRUE，反之是FALSE。！x是取非逻辑运算符，!is.na（a）表示a内元素不为NA，其对应的下标元素是TRUE，反之是FALSE。通过a[!is.na（a）]进行索引后，即可取出a内不为NA的元素，将其过滤。

其中，函数na.fail和 na.omit 不仅可以应用于向量，也可以应用于矩阵和数据框。

example：

data <- read.table(text="
a b c d e f
NA 1 1 1 1 1
1 NA 1 1 1 1
1 1 NA 1 1 1
1 1 1 NA 1 1
1 1 1 1 NA 1
1 1 1 1 1 NA",header=T)
na.omit(data)
data
>[1] a b c d e f
<0 行> (或0-长度的row.names)

---------------------
作者：SThranduil
来源：CSDN
原文：https://blog.csdn.net/SThranduil/article/details/71710283
版权声明：本文为博主原创文章，转载请附上博文链接！

满腹的小不甘

关注

14
点赞
踩
46

收藏

觉得还不错? 一键收藏
0
评论
R语言：na.fail和na.omit

实际工作中，数据集很少是完整的，许多情况下样本中都会包括若干缺失值NA，这在进行数据分析和挖掘时比较麻烦。R语言通过na.fail和na.omit可以很好地处理样本中的缺失值。na.fail（<向量a>）: 如果向量a内包括至少1个NA，则返回错误；如果不包括任何NA，则返回原有向量a na.omit（<向量a>）: 返回删除NA后的向量a att...
复制链接

扫一扫