1.read.table:可以读TXT也可以读CSV
(1)file:文件名
(2)header:是否包含表头
(3)sep:分隔符,如果不设定默认是空格
(4)dec:标志小数点符号,有些国家的小数点是逗号
(5)quote:字符串中间如果有引号的处理
(6)row.names:行名,行名不能重复。row.names=1,表示将第一列设置为行号
(7)col.names:列名
函数 read.table
是读取矩形格子状数据最为便利的方式。因为实际可能 遇到的情况比较多,所以预设了一些函数。这些函数调用了 read.table
但改变了它的一些默认参数。
注意,read.table
不是一种有效地读大数值矩阵的方法: 见下面的 scan
函数。
一些需要考虑到问题是:
- 编码问题
如果文件中包含非-ASCII字符字段,要确保以正确的编码方式读取。 这是在UTF-8的本地系统里面读取Latin-1文件的一个主要问题。 此时,可以如下处理
read.table(file("file.dat", encoding="latin1"))
注意,这在任何可以呈现Latin-1名字的本地系统里面运行。
- 首行问题
我们建议你明确地设定
header
参数。按照惯例,首行只有对应列的字段而 没有行标签对应的字段。因此,它会比余下的行少一个字段。 (如果需要在 R 里面看到这一行,设置header = TRUE
。) 如果要读取的文件里面有行标签的头字段(可能是空的), 以下面的方式读取read.table("file.dat", header &