现在有了雷地斯:readxl包可以轻松地从Excel中获取数据并进入R。与现有软件包(例如gdata、xlsx、xlsReadW区等)相比,readxl没有外部依赖关系,因此在所有操作系统上安装和使用都很容易。它用于处理存储在单个工作表中的表格数据。
readxl构建在libxls C库之上,它抽象出底层二进制格式的许多复杂性。
它既支持遗留的.xls格式,也支持.xlsx
readxl可以从cran获得,也可以通过以下方式从GitHub安装:# install.packages("devtools")devtools::install_github("hadley/readxl")
使用library(readxl)# read_excel reads both xls and xlsx filesread_excel("my-old-spreadsheet.xls")read_excel("my-new-spreadsheet.xlsx")
# Specify sheet with a number or nameread_excel("my-spreadsheet.xls", sheet = "data")read_excel("my-spreadsheet.xls", sheet = 2)
# If NAs are represented by something other than blank cells,# set the na argumentread_excel("my-spreadsheet.xls", na = "NA")
注意,虽然描述中说‘没有外部依赖’,但它确实需要Rcpp包装,这反过来需要Rtools(用于Windows)或Xcode(用于OSX),其中是除了R以外的依赖项,尽管许多人出于其他原因安装了它们。