导读:R语言有许多种方法去获取数据,最常用的是读取CSV文件。
作者:Jared P. Lander
来源:大数据DT(ID:hzdashuju)
读取CSV文件最好的方法是使用read.table
函数,许多人喜欢使用read.csv
函数,该函数其实是封装的read.table
函数,同时设置read.table
函数的sep
参数为逗号(",
")。read.table
函数返回的结果为data.frame
。
read.table
函数的第一个参数为文件所在路径,可以是本地文件,也可以是网页上的文件。本书主要是从网页读取文件。
任意CSV文件都可以读取,这里使用read.table
函数读取一个简单的文件(地址如下):
http://www.jaredlander.com/data/TomatoFirst.csv
> theUrl <-"http://www.jaredlander.com/data/TomatoFirst.csv"
> tomato <-read.table(file=theUrl, header=TRUE, sep=",")
利用head
命令,我们可以看到下面的结果。
> head(tomato)
如前面所述,第一个参数是文件名(或字符型变量)。注意我们如何显式地使用参数名file
、head
和sep
。函数的参数能够按位置顺序赋值,而不用显式指定参数名,但指定参数名是最佳实践。
第二个参数header
,表示数据的第一行,即列名。第三个参数sed
,表示数据的分隔符。可以设为“\t
”(tab分隔符)或者“;
”(分号分隔符),以读取不同类型的文件。