使用R语言的时候,如果是少量数据,不妨使用c()或其他函数进行创建;但是对于大量数据,最好还是先通过其他更方便的软件创建数据文件,然后使用R读入这个文件。
前文说,.csv是非常好的数据文件格式,跨平台支持非常好。我在Excel或者SPSS中创建的数据,只要存为csv格式,就可以使用几乎任何数据处理软件对这些数据进行处理了。使用通用格式在多人合作、不同版本兼容等常见行为中,优势十分明显。另外,之所以使用不同的数据处理软件,第一,可以取长补短。比如有些工作SPSS很复杂的,可以用R语言几行命令搞定。第二,可以进行软件间处理结果对照,发现问题。
R语言中读取外部文件的最基本函数是read.table(),先介绍read.table(),然后再介绍专门用来读csv的read.csv()。
敲入?read.table命令,就看到了关于数据输入函数的说明。对read.table,使用格式是这样的;
read.table(file, header = FALSE, sep =
"", quote = "\"'",
dec = ".", row.names,
col.names,
as.is = !stringsAsFactors,
na.strings = "NA", colClasses = NA,
nrows = -1,
skip = 0, check.names = TRUE, fill =
!blank.lines.skip,
strip.whi