一、读取csv文件
1.可以直接读取,无需安装包。
#读取以逗号为分隔组的CSV文件
data = read.csv('datafile.csv')
2.如果文件是有分隔符的类型,则需加上seq参数,如果是空格分隔符使用seq=’ ’如果是制表符分隔,使用\t,如果是逗号就是seq = ','。
#读取不同分隔符的数据
data = read.csv('datafile.csv',seq = '')
3.如果一个数据文件首行没有列名,加上header=FALSE可以增加列名,这时列名为v1,v2,v3…可对列名进行更改。
#读取没有列名的数据,这时会为数据自动生成列名v1,v2,v3...
data = read.csv('datafile.csv',header = FALSE)
#为列添加或更改列名
names(data) = c('column1','column2','culumn3')
4.在默认情况下字符串类型的数据列都被转换为因子型,一些数据分析和处理可能用的类型不同,可以进行相互转换。
#读取的数据字符串保留为字符串型
data = read.csv('datafile.csv',stringsAsFactors = FALSE)
#可再将其转换为字符型
data$column1 = factor(data$column)
二、读取excel文件
读取Execl文件可以将excel文件转换为csv文件再进行读取(打开excel文件、点击文件、点击另存为、选择保存地址、文件类型选择csv然后保存),也可以下载包,这里推荐使用readxl包,不推荐使用xlsx,使用xlsx还需要安装Java,如果没有的话就比较麻烦。
使用readxl读取excel文件。sheet参数为工作簿中的工作簿。
#读取excel文件
library(readxl)
data = read_excel('datafile.xlsx',sheet = '1')