![](https://img-blog.csdnimg.cn/20201014180756913.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
R
文章平均质量分 70
header_zj
搭建编程与统计的蜜汁象牙塔
展开
-
关于RStudio中的save问题
save.image()和load()在Rstudio中右上角处有一个environment,这里储存目前所有的运行过的的变量,而save.image()的作用是要把这些变量(或者已经跑好的函数)保存到一个RData文件。如果我们直接退出,RStudio会隐式得调用这个函数存储到一个未命名的RData文件(尽管在文件夹中显示类型为R Workspace)。如果是显示地调用这个函数,并且给出存储路径原创 2016-06-25 22:13:28 · 22667 阅读 · 1 评论 -
关于logistic regression小议
分布族family和连接函数loglogistic regression 一般用在用一些预测变量预测二元值变量,是回归与分类的结合体,然而我们不能直接用连续值的回归方法来预测一个离散值Y(0,1)Y(0,1),所以我们就转而考虑利用离散值的概率分布的期望来代替:首先我们就要先考虑离散值的概率分布,一般考虑为二项分布Binomial(2),我们由YY的概率分布的期望可以得到分布的一个参数p=E(Y)原创 2016-06-15 11:59:43 · 373 阅读 · 0 评论 -
R note(1)
title 相当于plotmainpaste 用lines可以向已有图中添加一条曲线而不是用plotlegend 编写函数可以返回一个列表且赋予表中每个部分名字Hmisc psych 包里都有describe如何使用被masked的包中同名函数取dataframe中元素的方法除了summary还可以用describe获得数据的简单统计量用来进行分类计算统计量的函数生成列联表检验原创 2016-06-13 20:01:00 · 309 阅读 · 0 评论 -
R note(2)
1.两个独立正态样本的均值t检验两种方法:t.test(y~x,data=) y是含有两种类的变量值,x则是一个factor类,标记y中的类别(一般只有在有formula参数的时候可以在括号里面加data=)t.test(y1,y2) 直接给出两个类的变量值 注:default假设两类的方差不同,需要用var.equal进行设定。alternative 可以选“less”,”greater”原创 2016-06-14 21:33:14 · 514 阅读 · 0 评论 -
R note(3)
1.fa.parallel图解释(用这个函数来选取主成分个数)fa.parallel(USJudgeRatings[,-1],fa = "pc", show.legend = F,n.iter = 100)abline(h = 1)用x标记的蓝线是scree plot,是选主成分个数的第一个准则,选转折很大的点 红色的线是用100个随机生成矩阵的p个特征值的平均值算出来的,选取原特征值比模拟特原创 2016-06-15 16:26:55 · 609 阅读 · 0 评论