转:
接下来继续看我们的read.table函数。
首先介绍一个非常有用的函数na.strings。na.strings在read.table中默认na.strings=“NA”。
“na”的意思是“not
available”,即“不可用”,在数据分析中我们更愿意称呼它“missing
values”------缺失值。这么一说大家就明白了,它是处理缺失值的。我们在整理录入数据的时候,有一些数据因为各种原因无法调查,称为缺失值。缺失值有时候会用特别的数字表示而不一定空着不填。如在统计某人群男子身高(cm)时,有的人没有记录上,那么可能缺失值会用“999”表示,因为人们是不会长到999cm的。我们录入数据时,这样的数据用999表示,但是并不希望它被计算。此时就可以用na.strings定义它。
我举一个例子:
先读取文件wq,看看是什么样子:
> setwd("E:/Rstore/")
> WQ=read.table("wq.txt",header=T)
> WQ
A B C D
1 12 65 78 98
2 56 89 87 78
3 78 87 56 98
4 98 89 24 56
5 78 87 87 12
6 96 89 33 45
7 23 78 69 65
8 23 98 82 86
9 65 87 12 45
这个是原表。假设我们现在认为数字98是缺失值,那么我们就这么录入:
WQ1=rea