R语言:na.fail和na.omit

       实际工作中,数据集很少是完整的,许多情况下样本中都会包括若干缺失值NA,这在进行数据分析和挖掘时比较麻烦。 
R语言通过na.fail和na.omit可以很好地处理样本中的缺失值。

  1. na.fail(<向量a>): 如果向量a内包括至少1个NA,则返回错误;如果不包括任何NA,则返回原有向量a
  2. na.omit(<向量a>): 返回删除NA后的向量a
  3. attr( na.omit(<向量a>) ,”na.action”): 返回向量a中元素为NA的下标
  4. is.na:判断向量内的元素是否为NA

example:

data<-c(1,2,NA,2,4,2,10,NA,9)
data.na.omit<-na.omit(data)
data.na.omit
    [1]  1  2  2  4  2  10  9
    attr(,"na.action")
    [1] 3 8
    attr(,"class")
    [1] "omit"


attr(data.na.omit,"na.action")
    [1] 3 8
    attr(,"class")
    [1] "omit"


另外还可以使用!x方式方便地删除NA。例如:

a<-c(1,2,3,NA,NA,2,NA,5)

a[!is.na(a)]

[1] 1 2 3 2 5 


       其中,is.na用于判断向量内的元素是否为NA,返回结果:c(FALSE,FALSE,FALSE,TRUE,TRUE,FALSE,TRUE,FALSE),即a内元素为NA,其对应的下标元素是TRUE,反之是FALSE。!x是取非逻辑运算符,!is.na(a)表示a内元素不为NA,其对应的下标元素是TRUE,反之是FALSE。通过a[!is.na(a)]进行索引后,即可取出a内不为NA的元素,将其过滤。

  • 其中,函数na.fail和 na.omit 不仅可以应用于向量,也可以应用于矩阵和数据框。
     

example:

data <- read.table(text="
a b c d e f
NA 1 1 1 1 1
1 NA 1 1 1 1
1 1 NA 1 1 1
1 1 1 NA 1 1
1 1 1 1 NA 1
1 1 1 1 1 NA",header=T)
na.omit(data)
data
>[1] a b c d e f
<0 行> (或0-长度的row.names)


--------------------- 
作者:SThranduil 
来源:CSDN 
原文:https://blog.csdn.net/SThranduil/article/details/71710283 
版权声明:本文为博主原创文章,转载请附上博文链接!

  • 14
    点赞
  • 46
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值