R包是一些为了便于分发和传播而封装子啊一起的函数和(或)数据集(可以没有数据集)的集合。发布R软件包的最主要的软件包仓库是CRAN (Comprehensive R Archive Network), 在全球有许多镜像,其中Austria站点是CRAN的主站点。也有其他仓库(Bioconductor, Omegahat)
安装包、使用包和加载数据
1 从CRAN安装R包
#安装ggplot2和gcookbook包
install.packages(c("ggplot2","gcookbook"))
2 在每个R会话中,需要在使用前先加载包
library(ggplot2)
library(gcookbook)
3 加载数据文件
#1 加载CSV(分隔符式文本)文件
data<-read.csv("datafile.csv")
#数据集首行没有列名
data<-read.csv("datafile.csv" , header=FALSE)
#手动为列名赋值
names(data) <-c("Column1", "Column2", "Column3")
#设置分隔符, sep=""
data<-read.csv("datafile.csv" , sep="\t")
#改变默认将列存储为因子(factor)
data<-read.csv("datafile.csv" , stringAsFactors=FALSE)
#转换为因子
data$Sex<-factor(data$Sex)
#
str(data)
# 2 从Excel文件中加载数据
install.packages("xlsx")
library(xlsx)
data <- read.xlsx("datafile.xlsx")
#97版Excel .xls格式,使用gdata包的read.xls()函数
#只需要安装一次
install.packages("gdata")
library(gdata)
#读取第一张工作表
data <- read.xls("datafile.xls")
data <- read.xls("datafile.xls", sheetIndex=2)
data <- read.xls("datafile.xls", sheetName="Revenues")
data <- read.xls("datafile.xls", sheet=2)