一、导入CSV文件:
先执行:bankloan<-read.csv('d:/用户目录/下载/01-R语言数据科学入门/data/bankloan.csv',header = TRUE)
第一次执行上面代码一般会报错:
所以我们要解决问题,安装readr包:
每次安装完包都要library(readr)一下。
而readr包要执行如下代码:
bankloan<-read_csv('d:/用户目录/下载/01-R语言数据科学入门/data/bankloan.csv')
二、导入utf-8编码的csv文件:
按照原来的做法用RStudio自带的read.csv一般会出问题:
bankloan<-read.csv('d:/用户目录/下载/01-R语言数据科学入门/data/bankloan_UTF-8.csv',
header = TRUE,
encoding = 'UTF-8'
)
所以,真对csv文件推荐用readr包:
bankloan_utf_8<-readr::read_csv('d:/用户目录/下载/01-R语言数据科学入门/data/bankloan_UTF-8.csv')
用view(bankloan_utf_8)来看csv文件内容
三、导入Excel格式的数据文件
由上面导入csv文件可知,要借助于readxl包,依旧需要安装和library,然后执行如下代码:
bankloan_excel<-read_excel('d:/用户目录/下载/01-R语言数据科学入门/data/bankloan.xlsx',
sheet = 'bankloan')
上面代码括号里的sheet = ''这个表示excel表里的表名。最后view()一下查看内容
四、将数据存储到本地,格式为csv,编码为gbk
以ggplot2里的文件数据为例,首先看一下ggplot2这个包安装了没,library(ggplot2)。然后查看一下其diamonds中的数据集,head(diamonds)。最后执行以下代码:
write.csv(diamonds, 这个表示要存储的数据集
file = 'd:/用户目录/下载/01-R语言数据科学入门/data/diamonds1.csv', 表示存储的绝对位置
fileEncoding = 'utf-8', 以什么格式存储
row.names = FALSE 去掉前面的row
)
五、使用相对路径
先设置工作目录:
setwd('e:/Rget/') 表示更改相对路径
getwd() 查看相对路径bankloan_relative<-read_csv('./bankloan.csv') 将相对路径里的内容导进来
head(bankloan_relative) 查看
六、导入其他统计软件的数据
以SPSS为例,read_spss需要haven包,所以先检查有没有haven包,library(haven)。没有就安装。
library(haven)
bankloan_spss <- read_spss('./data/bankloan.sav')
head(bankloan_spss)
七、将R内置数据集存储为spss软件数据格式
require(ggplot2)
haven::write_sav(diamonds,path = './diamonds.sav')