一.R获取数据的三种途径
(一)利用键盘输入数据(初始数据如下)
1.使用edit召唤允许手动输入的文本编辑器来修改数据框,但是首先必须要先定义变量,再用edit修改变量,
否则修改后的数据无法保存(以下为未保存变量情况)
输出后结果,显示原始数据未保存
声明变量后保存的结果(以x为变量)
输出后结果,显示已经保存
2.或者可以使用fix()函数直接修改数据,这样也可以直接保存(以修改第一行数据为例)
输出结果,修改的数值得以保存
在linux中无法使用文本编辑器时,会打开vim进行编辑
3.直接读取剪贴板上的数据
具体格式如下
例如读入学分excel表
使用代码导入R语言后
(二)通过读取存储在外部文件上的数据
1.纯文本文件(TXT)
格式:read.table("path", header=TRUE, sep="分隔符")
参数1是指定文件所在路径,若文本文件是在网络中,复制该文件具体网址表格的URL到函数中即可
参数2为TRUE时是先把文件第一行读取出来,在本文件里第一行是各列的属性值,故需设为TRUE,
参数3是指定文件中个值之间的分隔符,本文件是以英文逗号(,)分隔开的,故设sep=","其他格式还有空格、\t等
例如读取D盘一个名为accident.txt的文件
2.读取EXCEL文件
格式:read.csv("path", header=TRUE, sep="分隔符")
具体参数设置同read.table
例如读取一个bus.csv的文件
导入R语言后
3.读取xlsx文件
读入xlsx需要下加载xlsx包,如果没有这个包的请自行安装,这个包的使用会依赖rJava和xlsxjars,所以这两个也是要安装的,还要有java的环境。
具体使用语法如下
其余设置与上述两个相同,其中sheetIndex用来选择读取的sheet表格,数字几代表第几个
(三)通过访问数据库系统来获取数据
通过ODBC访问数据库,通过RODBC包授权R与拥有ODBC的SQL数据库进行连接,读取数据库内容,并将R所修改的内容写入数据库
可以通过DBI包访问数据库,通过相关驱动访问,使用这个包需要下载与DBI相连的数据库包才能使用
这里使用RmySQL作为演示