这一节介绍数据的读入和写入,要在R中做数据分析,首先需要将相关的数据读入,读入的方法多种多样,即使同一个文件,加载不同的包都有不同的读入方法,这里介绍一些比较常见的。
直接编辑
可以通过直接输入的方式输入数据,编辑的对象是数据框,如:
data1
fix(data1)
这里的fix函数是打开表格,你就可以直接输入数据,打开的操作界面如下:
然后我们在第二行第一列直接输入一个数据3,然后点击关闭
然后再打开,可以看到数据3已经在里面了:
还有另一个很类似的是edit,这个是编辑变量的名称和类型
粘贴板中读入
这个是表示已经将数据复制了,这时候是存储在内存里面,通过read.table中clipboard读入的,例如你复制了一个excel表格数据,然后运行如下代码:
data2
head(data2)
然后你在用head(data2)看一下数据的格式有没问题,现在Rstudio已经能够完美支持中文的了,三四年前读入中文还是乱码的。
read.table的功能很强大,具体在后面再详细介绍。
外部文件
前面两种能读入的数据量级和效率是比较糟糕的,通常在分析的时候是读入外部文件和直接连接数据库去处理数据