最近刚刚接触R,暂时学习了一些基本的数据读入操作,简单记录一下:
假设有如下数据存在Excel里:
Alice Bob
1 2
3 4
假设你只想读入数据矩阵部分,那么圈住它,复制,然后再R里输入:
>>Data<-read.table("clipboard")
就可以直接从剪切板里读入数据了,如下
>>Data
V1 V2
1 1 2
2 3 4
read.table读入的是数据框格式,可以用Data[1,]取第一行,也可以用Data$V1取第一列。
感觉对于一次性使用的数据,直接复制然后从剪切板读入是非常方便的。此方法也适用于读入MATLAB里Array Editor里的数据。
如果想同时读入包括表头的整个表,同理,圈住整个表复制,
>> Data<-read.table("clipboard")
> >Data
Alice Bob
1 1 2
2 3 4
当处理多个数据时,用剪切板的方法就不太靠谱了,一般肯定是将数据存在文件里再由R读入。以.csv文件为例(Excel保存数据时可以选择保存的格式为.csv)。
如果.csv里保存了数据表,包括表头,那就直接用read.csv("filename")就可以了。需要注意的是,如果数据表不包括表头,那么如果直接用刚才的命令,读入的就会是这样:
X1 X2
1 3 4
原因是此函数默认第一行是表头。解决方法是改一下参数即可:
>>Data<-read.csv("input.csv",header=FALSE)
这样读入的数据就正常了:
>> Data
V1 V2
1 1 2
2 3 4