读取数据(中小型)
- read.table /read.csv 读取外部数据
- readlines()逐行读取文本文件数据
- source() 读取R代码文件(用于dump后)
- dget 读取R代码文件(逆句法分析dput,后)
- load()and serialize()用于读取二进制文件
读取大型数据
r如果能添加读取的类型,速度会快很多
intial<-read.table('datetable.txt',nrow=100) #先读取100行
classes<-sapply(intial,class) #查看类别
taball《-read.table('datet.able.txt',colClasses=classes)
取子集
[ ] 取的类型和原类型一样,如x是列表,x[1]也是列表
[[ ]] 好处在于可以使用计算后的结果
$ 和[[]]相似,好处是可以模糊匹配,如x$a,列表里没有a,但有aak,会返回aak的值
缺失数据
1、检查是否有缺失值 is.na()如bad<-is.na(x)
2.取非缺失数据 x[!bad]
如果有多个对象
1、利用complete,cases()查看没有缺失值的子集
2.利用索引取得不包含缺失值的数据 如