2013年02月_swuteresa

原创编写R包（2）

简单过程在R Gui中：（1）创建数据，定义函数（2）package.skeleton(name="anRpackage",list,environment=.GlobalEnv,path=".",force=FALSE,namespace=FALSE,code_files=character())将会在path下面生成一个名为anRpackage的文件夹，里面包含了list中的对

2013-02-02 21:25:29 815

原创编写R包（1）

用help.start()查看R帮助的开始页，其中Writing R Extensions章节详细介绍。1.1.1小节和1.1.3小节：R包的结构1.6小节：命名空间5节：底层语言的使用下载Rtools工具和LaTex程序查看R的安装路径：（1）R.home("bin")（2）R.home("library")需要设置PATH R包的结构：pkg（

2013-02-02 21:09:12 1554

原创 factor因子

factor不仅包括分类变量本身，还包括变量不同的可能水平，即使他们不在数据中出现。创建一个因子：factor(x=character(),levels=sort(unique(x),na.last=TRUE),labels=levels,exclude=NA,ordered=is.ordered(x))与之相关的有：ordered(x, ...)is.factor(x)i

2013-02-02 20:48:55 2392

原创 R调用matlab

#安装R.matlab包install.packages("R.matlab") #载入R.matlab包library(R.matlab) #设置matlab文件的路径path #读取matlab文件mat #对读取内容（存放在mat变量中）进行操作（mat变量）sfieldscat("Field names:",paste(fiel

2013-02-02 17:25:36 8691

原创 mer类

lmer函数的结果为一个mer类的对象 mer类：描述线性、通用线性或非线性混合效应模型，包含稀疏的模型矩阵（随机效应的）以及相应的稀疏Cholesky因子。summary.mer类描述这些对象的summary。用法：deviance(object,REML=NULL,...)expand(x,sparse=TRUE,...)logLik(object,REML=

2013-02-02 16:50:48 986

原创 anova

anova{stats}Anova Tablescompute analysis of variance or deviance tables for one or more fitted model objects anova(object,...)其中：object：包含一个模型的拟合函数（lmer或lm，glm）的结果对象...：其他的同类对象 anova

2013-02-02 16:06:12 1004

原创 lmer：Fit mixed-Effects Models

lmer{lmer4}拟合一个线性混合模型或通用线性混合模型或非线性混合模型 lmer(formula,data,family=NULL,REML=TRUE,control=list(),start=NULL,verbose=FALSE,doFit=TRUE,sunset,weights,na,action,offset,contrasts=NULL,model=TRUE,X=TRUE

2013-02-02 15:58:24 15977

原创 list, data frame与S4对象

一个S4对象的槽slot访问：对象名@槽名一个data.frame对象的变量variables访问：数据框$变量名在data.frame中，行表示subjects/observations，列表示variables/characteristics 执行attach(dataframeX)，将attaching dataframeX to the R search path，此后，“

2013-02-02 12:59:39 3200

原创匹配：match与%in%操作符

match{base}returns a vector of the positions of (first) matches of its first argument in its second. %in%is a more intuitive interface as a binary operator, which returns a logical vector indi

2013-02-02 11:46:25 4397

原创 table函数

对factor分类属性统计其frequency distribution 计算列联表table：uses the cross-classifying factors to build a contingency table of the counts at each combination of factor levels统计每对factor水平组合出现的次数。 table(x

2013-02-01 22:39:52 23696

原创 R中的各种apply函数

lapply：可用于一个列表对象，并且返回一个列表对象sapply：更灵活，可接受向量或者矩阵作为主要参数，返回形式更为有好的结果，常常是表格形式。 lapply(x,FUN,...)sapply(x,FUN,...,simplify=TRUE,USE.NAMES=TRUE)vapply(x,FUN,FUN.VALUE,...,USE.NAMES=TRUE)replicat

2013-02-01 21:41:19 9551

原创 R将绘图结果保存为文件

1.postcript("filename.ps").....#绘图指令postscript() 1.jpeg(file="filename.jpg")......#绘图指令dev.off() #关闭图形文件

2013-02-01 21:22:01 5040

原创 R语言的流程控制

ifelse(X,Y,Z)若X成立，则执行Y，否则执行Z if(cond) exprif(cond) cons.expr else alt.exprfor(var in seq) exprwhile(cond) exprrepeat expr在三种循环中可以用break和next for(i in 1:length(x)) 循环有时可避免使用循环，方法：

2013-02-01 21:13:35 8206

原创 EM算法：Expectation-Maximization

目标：找出有隐形变量的概率模型的最大可能性解。它分为两个过程：E-step和M-step1.E-step：通过最初假设或上一步得出的模型参数得到后验概率；2.M-step：重新算出模型的参数。重复这两个过程直到目标函数值收敛。 EM算法即期望值最大算法，被誉为是数据挖掘的十大算法之一，它是在概率模型中寻找参数最大似然估计的算法。其中概率模型依赖于无法观测到的隐变量。最大期望

2013-02-01 20:55:11 1065

原创 mixed model混合模型

混合模型是一个统计模型，包含fixed effects和random effects两种效应的混合。当重复衡量（1）相同的统计单元，或（2）聚类，或（3）相关的统计单元时，混合模型尤其有效。Ronald Fisher研究亲属间性状值的相关性时，引入random effects modes。1950年代，Charles Roy Henderson提出（1）fixed effects的BL

2013-02-01 20:38:50 18214

原创 About GS

Implementation of Genomic Selection conceptually proceeds in two steps:(1) Estimation of the effects of chromosome segments in a reference population and(2)Prediction of genomic EBVs(GEBVs) for an

2013-02-01 15:56:19 1002

原创 rrBLUP

可用于genomic selection基因组选择和association mapping关联映射rrBLUP包中的核心函数：1.mixed.solve把标记效应建模为随机效应或把行数据的基因型（genotypic）值用于A.mat函数（计算加性关系矩阵，预测育种值）2.kinship.BLUP：包含上位效应在基因型值预测中3.GWA：关联映射处理缺失的数据：

2013-02-01 15:48:24 6228

原创 ridge regression岭回归

岭回归用于处理下面两类问题：1.数据点少于变量个数2.变量间存在共线性变量间存在共线性是，最小二乘回归得到的系数不稳定，方差很大，这是因为系数矩阵x与它的转置矩阵相乘得到的矩阵不能求逆，而ridge regression通过引入lamda参数，使得该问题得到解决。在R语言中，MASS包中的函数lm.ridge()可以很方便地完成。它的输入矩阵x始终为n*p维，不管是否包含常数项。

2013-02-01 13:56:04 36345

原创 R命令（4）

log(x)：求x的自然对数 log10(x)：求x的对数（以10为底） t(x)：求x的转置x` 求n!：factorial(n)，prod(1:n)，gamma(n+1) quantile(x)：求x向量的0%、25%、50%、75%、100%等5个分位数值 summary(x)：求x（变量，data.frame或是cbind的结果）的Min（最小值）、

2013-02-01 13:11:40 1876

原创 R命令（3）：内存管理与垃圾清理

memory.limit()：查看内存大小memory.limit(n)：申请内存大小memory.size(NA)：查看内存大小memory.size(T)：查看已分配的内存memory.size(F)：查看已使用的内存在Windows开始菜单运行：Rgui -max-mem-size 2GB与在R GUI中执行：memory.limit(2000)都能申请2G

2013-02-01 12:51:18 13351 1

原创 R命令（2）

?：访问帮助文件#：添加注释system.time(operations)：查看操作消耗的时间system.file(package=str)：查看包str所在的文件路径 example(methodX)：显示函数methodX的使用例子methods(methodX)：查看函数methodX在默认包中所有可利用的函数（OOP）getAnywhere(methodX)：

2013-02-01 11:58:21 995

原创 R命令（1）

getwd()：查看当前工作路径setwd(str)：设置工作路径为strlibrary()：查看当前可用包library(x)：载入包xcitation(x)：查看包x的引用信息search()：查看已载入的包detach(package:x)：取消包x的载入remove.package("x")：取消包x的安装（卸载包x）ls()：查看workplace中的所有

2013-02-01 11:35:44 710

swuteresa的专栏