R作为一个开放的系统,它与其他应用软件,尤其是数据处理软件,比如Excel,SPSS等有着密切的资源共享性,相互之间进行数据调用非常方便。下面就常见的几种读取数据的方法进行分类描述,内容持续更新。。。
我们在每次开始用R进行工作前,可以先考虑使用setwd()函数设定常用工作路径,以省去之后可能需要的多次指定文件获取、修改、保存路径的操作,或者在每次读取时设置路径都可以。
1.读取.csv文件
csv是逗号分隔值文件格式,csv(逗号分隔值)是一种用来存储数据的纯文本文件,通常都是用于存放电子表格或数据的一种文件格式。
本例中用到的数据集是来自于R下MASS包中的Insurance.csv文件。文件位置一般在包的安装目录下的data文件夹下。例如下图是我电脑中的Insurance.csv文件存放位置。
> setwd("D://R包//MASS//data") #设置默认路径
> write.csv(Insurance,"Insurance.csv") #将Insurance数据集以csv格式存入指定路径
> Insur=read.csv("Insurance.csv") #使用read.csv()函数直接读取
> head(Insur) #查看读取到的部分数据
X District Group Age Holders Claims
1 1 1 <1l <25 197 38
2 2 1 <1l 25-29 264 35
3 3 1 <1l 30-35 246 20
4 4 1 <1l >35 1680 156
5 5 1 1-1.5l <25 284 63
6 6 1 1-1.5l 25-29 536 84
>
也可使用read.table()函数读取数据
> Insur_1=read.table("Insurance.csv") #<span style="color: rgb(51, 51, 51); font-family: 'Microsoft Yahei', Tahoma, Simsun; font-size: 15px; line-height: 27px;">使用read.table()函数读取数据</span>
> head(Insur_1) #查看读取到的部分数据
V1 V2
1 NA ,"District","Group","Age","Holders","Claims"
2 1 ,"1","<1l","<25",197,38
3 2