自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(22)
  • 收藏
  • 关注

原创 编写R包(2)

简单过程在R Gui中:(1)创建数据,定义函数(2)package.skeleton(name="anRpackage",list,environment=.GlobalEnv,path=".",force=FALSE,namespace=FALSE,code_files=character())将会在path下面生成一个名为anRpackage的文件夹,里面包含了list中的对

2013-02-02 21:25:29 815

原创 编写R包(1)

用help.start()查看R帮助的开始页,其中Writing R Extensions章节详细介绍。1.1.1小节和1.1.3小节:R包的结构1.6小节:命名空间5节:底层语言的使用 下载Rtools工具和LaTex程序查看R的安装路径:(1)R.home("bin")(2)R.home("library")需要设置PATH R包的结构:pkg(

2013-02-02 21:09:12 1554

原创 factor因子

factor不仅包括分类变量本身,还包括变量不同的可能水平,即使他们不在数据中出现。创建一个因子:factor(x=character(),levels=sort(unique(x),na.last=TRUE),labels=levels,exclude=NA,ordered=is.ordered(x))与之相关的有:ordered(x, ...)is.factor(x)i

2013-02-02 20:48:55 2392

原创 R调用matlab

#安装R.matlab包install.packages("R.matlab")  #载入R.matlab包library(R.matlab) #设置matlab文件的路径path #读取matlab文件mat #对读取内容(存放在mat变量中)进行操作(mat变量)sfieldscat("Field names:",paste(fiel

2013-02-02 17:25:36 8691

原创 mer类

lmer函数的结果为一个mer类的对象 mer类:描述线性、通用线性或非线性混合效应模型,包含稀疏的模型矩阵(随机效应的)以及相应的稀疏Cholesky因子。summary.mer类描述这些对象的summary。 用法:deviance(object,REML=NULL,...)expand(x,sparse=TRUE,...)logLik(object,REML=

2013-02-02 16:50:48 986

原创 anova

anova{stats}Anova Tablescompute analysis of variance or deviance tables for one or more fitted model objects anova(object,...)其中:object:包含一个模型的拟合函数(lmer或lm,glm)的结果对象...:其他的同类对象 anova

2013-02-02 16:06:12 1004

原创 lmer:Fit mixed-Effects Models

lmer{lmer4}拟合一个线性混合模型或通用线性混合模型或非线性混合模型 lmer(formula,data,family=NULL,REML=TRUE,control=list(),start=NULL,verbose=FALSE,doFit=TRUE,sunset,weights,na,action,offset,contrasts=NULL,model=TRUE,X=TRUE

2013-02-02 15:58:24 15977

原创 list, data frame与S4对象

一个S4对象的槽slot访问:对象名@槽名一个data.frame对象的变量variables访问:数据框$变量名在data.frame中,行表示subjects/observations,列表示variables/characteristics 执行attach(dataframeX),将attaching dataframeX to the R search path,此后,“

2013-02-02 12:59:39 3200

原创 匹配:match与%in%操作符

match{base}returns a vector of the positions of (first) matches of its first argument in its second. %in%is a more intuitive interface as a binary operator, which returns a logical vector indi

2013-02-02 11:46:25 4397

原创 table函数

对factor分类属性统计其frequency distribution 计算列联表table:uses the cross-classifying factors to build a contingency table of the counts at each combination of factor levels统计每对factor水平组合出现的次数。 table(x

2013-02-01 22:39:52 23696

原创 R中的各种apply函数

lapply:可用于一个列表对象,并且返回一个列表对象sapply:更灵活,可接受向量或者矩阵作为主要参数,返回形式更为有好的结果,常常是表格形式。 lapply(x,FUN,...)sapply(x,FUN,...,simplify=TRUE,USE.NAMES=TRUE)vapply(x,FUN,FUN.VALUE,...,USE.NAMES=TRUE)replicat

2013-02-01 21:41:19 9551

原创 R将绘图结果保存为文件

1.postcript("filename.ps").....#绘图指令postscript() 1.jpeg(file="filename.jpg")......#绘图指令dev.off()  #关闭图形文件

2013-02-01 21:22:01 5040

原创 R语言的流程控制

ifelse(X,Y,Z)若X成立,则执行Y,否则执行Z if(cond) exprif(cond) cons.expr else alt.exprfor(var in seq) exprwhile(cond) exprrepeat expr在三种循环中可以用break和next for(i in 1:length(x)) 循环有时可避免使用循环,方法:

2013-02-01 21:13:35 8206

原创 EM算法:Expectation-Maximization

目标:找出有隐形变量的概率模型的最大可能性解。它分为两个过程:E-step和M-step1.E-step:通过最初假设或上一步得出的模型参数得到后验概率;2.M-step:重新算出模型的参数。重复这两个过程直到目标函数值收敛。 EM算法即期望值最大算法,被誉为是数据挖掘的十大算法之一,它是在概率模型中寻找参数最大似然估计的算法。其中概率模型依赖于无法观测到的隐变量。最大期望

2013-02-01 20:55:11 1065

原创 mixed model混合模型

混合模型是一个统计模型,包含fixed effects和random effects两种效应的混合。当重复衡量(1)相同的统计单元,或(2)聚类,或(3)相关的统计单元时,混合模型尤其有效。Ronald Fisher研究亲属间性状值的相关性时,引入random effects modes。1950年代,Charles Roy Henderson提出(1)fixed effects的BL

2013-02-01 20:38:50 18214

原创 About GS

Implementation of Genomic Selection conceptually proceeds in two steps:(1) Estimation of the effects of chromosome segments in a reference population and(2)Prediction of genomic EBVs(GEBVs) for an

2013-02-01 15:56:19 1002

原创 rrBLUP

可用于genomic selection基因组选择和association mapping关联映射rrBLUP包中的核心函数:1.mixed.solve把标记效应建模为随机效应或把行数据的基因型(genotypic)值用于A.mat函数(计算加性关系矩阵,预测育种值)2.kinship.BLUP:包含上位效应在基因型值预测中3.GWA:关联映射 处理缺失的数据:

2013-02-01 15:48:24 6228

原创 ridge regression岭回归

岭回归用于处理下面两类问题:1.数据点少于变量个数2.变量间存在共线性变量间存在共线性是,最小二乘回归得到的系数不稳定,方差很大,这是因为系数矩阵x与它的转置矩阵相乘得到的矩阵不能求逆,而ridge regression通过引入lamda参数,使得该问题得到解决。在R语言中,MASS包中的函数lm.ridge()可以很方便地完成。它的输入矩阵x始终为n*p维,不管是否包含常数项。

2013-02-01 13:56:04 36345

原创 R命令(4)

log(x):求x的自然对数 log10(x):求x的对数(以10为底) t(x):求x的转置x` 求n!:factorial(n),prod(1:n),gamma(n+1) quantile(x):求x向量的0%、25%、50%、75%、100%等5个分位数值 summary(x):求x(变量,data.frame或是cbind的结果)的Min(最小值)、

2013-02-01 13:11:40 1876

原创 R命令(3):内存管理与垃圾清理

memory.limit():查看内存大小memory.limit(n):申请内存大小memory.size(NA):查看内存大小memory.size(T):查看已分配的内存memory.size(F):查看已使用的内存 在Windows开始菜单运行:Rgui -max-mem-size 2GB与在R GUI中执行:memory.limit(2000)都能申请2G

2013-02-01 12:51:18 13351 1

原创 R命令(2)

?:访问帮助文件#:添加注释system.time(operations):查看操作消耗的时间system.file(package=str):查看包str所在的文件路径 example(methodX):显示函数methodX的使用例子methods(methodX):查看函数methodX在默认包中所有可利用的函数(OOP)getAnywhere(methodX):

2013-02-01 11:58:21 995

原创 R命令(1)

getwd():查看当前工作路径setwd(str):设置工作路径为strlibrary():查看当前可用包library(x):载入包xcitation(x):查看包x的引用信息search():查看已载入的包detach(package:x):取消包x的载入remove.package("x"):取消包x的安装(卸载包x)ls():查看workplace中的所有

2013-02-01 11:35:44 710

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除