R包是一些为了便于分发和传播而封装子啊一起的函数和(或)数据集(可以没有数据集)的集合。发布R软件包的最主要的软件包仓库是CRAN (Comprehensive R Archive Network), 在全球有许多镜像,其中Austria站点是CRAN的主站点。也有其他仓库(Bioconductor, Omegahat)
安装包、使用包和加载数据
1 从CRAN安装R包
安装ggplot2和gcookbook包
install.packages(c("ggplot2","gcookbook"))
2 加载R包
在每个R会话中,需要在使用前先加载包
library(ggplot2)
library(gcookbook)
3 加载数据文件
1 加载CSV(分隔符式文本)文件
data<-read.csv("datafile.csv")
#数据集首行没有列名
data<-read.csv("datafile.csv" , header=FALSE)
#手动为列名赋值
names(data) <-c("Column1", "Column2", "Column3")
#设置分隔符, sep=""
data<-read.csv("datafile.csv" , sep="\t")
#改变默认将列存储为因子(factor)
data<-read.csv("datafile.csv" , stringAsFactors=FALSE)
#转换为因子
data$Sex<-factor(data$Sex)
#
str(data)
2 从Excel文件中加载数据
install.packages("xlsx")
library(xlsx)
data <- read.xlsx("datafile.xlsx")
#97版Excel .xls格式,使用gdata包的read.xls()函数
#只需要安装一次
install.packages("gdata")
library(gdata)
#读取第一张工作表
data <- read.xls("datafile.xls")
#使用序数参数sheetIndex指定工作表
data <- read.xls("datafile.xls", sheetIndex=2)
#使用表名sheetName指定工作表
data <- read.xls("datafile.xls", sheetName="Revenues")
#使用序数参数sheet指定工作表
data <- read.xls("datafile.xls", sheet=2)
R包依赖
xlsx包需要安装Java;对于gdata包,windows平台需要安装ActiveState Perl(社区版本免费)
从SPSS文件中加载数据
foreign包中的函数read.spss()读取SPSS文件
install.packages(“foreign”)
library(foreign)
data <- read.spss(“datafile.csv”)