r语言用行名称提取数据框信息显示na_R语言初级教程(20): 数据框(中篇)

接着上一篇的内容,我们继续介绍数据框的处理。

5. 删除包含缺失值NA的行

在统计建模中,拥有一个在响应或解释变量中不包含任何缺失值的数据框通常很有用,可以使用na.omit()函数来达到这个目的。 这是worms的姊妹版数据框,其中某些值为NA:

> data

> data

Field.Name Area Slope Vegetation Soil.pH Damp Worm.density

1 Nashs.Field 3.6 11 Grassland 4.1 FALSE 4

2 Silwood.Bottom 5.1 NA Arable 5.2 FALSE 7

3 Nursery.Field 2.8 3 Grassland 4.3 FALSE 2

4 Rush.Meadow 2.4 5 Meadow 4.9 TRUE 5

5 Gunness.Thicket 3.8 0 Scrub 4.2 FALSE 6

6 Oak.Mead 3.1 2 Grassland 3.9 FALSE 2

7 Church.Field 3.5 3 Grassland NA NA NA

8 Ashurst 2.1 0 Arable 4.8 FALSE 4

9 The.Orchard 1.9 0 Orchard 5.7 FALSE 9

10 Rookery.Slope 1.5 4 Grassland 5.0 TRUE 7

11 Garden.Wood 2.9 10 Scrub 5.2 FALSE 8

12 North.Gravel 3.3 1 Grassland 4.1 FALSE 1

13 South.Gravel 3.7 2 Grassland 4.0 FALSE 2

14 Observatory.Ridge 1.8 6 Grassland 3.8 FALSE 0

15 Pond.Field 4.1 0 Meadow 5.0 TRUE 6

16 Water.Meadow 3.9 0 Meadow 4.9 TRUE 8

17 Cheapside 2.2 8 Scrub 4.7 TRUE 4

18 Pound.Hill 4.4 2 Arable 4.5 FALSE 5

19 Gravel.Pit NA 1 Grassland 3.5 FALSE 1

20 Farm.Wood 0.8 10 Scrub 5.1 TRUE 3

通过检查,可以看到我们想要去掉第2行(1个NA值)、第7行(3个NA值)和第19行(1个NA值):

> na.omit(data)

Field.Name Area Slope Vegetation Soil.pH Damp Worm.density

1 Nashs.Field 3.6 11 Grassland 4.1 FALSE 4

3 Nursery.Field 2.8 3 Grassland 4.3 FALSE 2

4 Rush.Meadow 2.4 5 Meadow 4.9 TRUE 5

5 Gunness.Thicket 3.8 0 Scrub 4.2 FALSE 6

6 Oak.Mead 3.1 2 Grassland 3.9 FALSE 2

8 Ashurst 2.1 0 Arable 4.8 FALSE 4

9 The.Orchard 1.9 0 Orchard 5.7 FALSE 9

10 Rookery.Slope 1.5 4 Grassland 5.0 TRUE 7

11 Garden.Wood 2.9 10 Scrub 5.2 FALSE 8

12 North.Gravel 3.3 1 Grassland 4.1 FALSE 1

13 South.Gravel 3.7 2 Grassland 4.0 FALSE 2

14 Observatory.Ridge 1.8 6 Grassland 3.8 FALSE 0

15 Pond.Field 4.1 0 Meadow 5.0 TRUE 6

16 Water.Meadow 3.9 0 Meadow 4.9 TRUE 8

17 Cheapside 2.2 8 Scrub 4.7 TRUE 4

18 Pound.Hill 4.4 2 Arable 4.5 FALSE 5

20 Farm.Wood 0.8 10 Scrub 5.1 TRUE 3

可以看到第2,7,19行被删掉了。

测试数据框中是否存在缺失值的函数是complete.cases():

> complete.cases(data)

[1] TRUE FALSE TRUE TRUE TRUE TRUE FALSE TRUE TRUE TRUE TRUE TRUE

[13] TRUE TRUE TRUE TRUE TRUE TRUE FALSE TRUE

因此你也可以通过下列方式删除NA行:

> data[complete.cases(data), ]

Field.Name Area Slope Vegetation Soil.pH Damp Worm.density

1 Nas

  • 1
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值