R常用数据分析模型
文章平均质量分 87
Tiaaaaa
这个作者很懒,什么都没留下…
展开
-
R语言逻辑回归、ROC曲线和十折交叉验证
自己整理编写的逻辑回归模板,作为学习笔记记录分享。数据集用的是14个自变量Xi,一个因变量Y的australian数据集。1. 测试集和训练集3、7分组australian <- read.csv("australian.csv",as.is = T,sep=",",header=TRUE)#读取行数N = length(australian$Y)原创 2017-02-27 15:49:35 · 137095 阅读 · 64 评论 -
R语言聚类分析
自己整理编写的R语言常用数据分析模型的模板,原文件为Rmd格式,直接复制粘贴过来,作为个人学习笔记保存和分享。部分参考薛毅的《统计建模与R软件》和《R语言实战》聚类分析是一类将数据所研究对象进行分类的统计方法,这一类方法的共同特点是:事先不知道类别的个数和结构,据以进行分析的数据是对象之间的相似性或相异性的数据。将这些相似(相异)性数据看成是对象之间的“距离”远近的一种度量,将距离近的变量归为一类,原创 2017-02-27 17:10:27 · 52435 阅读 · 3 评论 -
R语言判别分析
自己整理编写的R语言常用数据分析模型的模板,原文件为Rmd格式,直接复制粘贴过来,作为个人学习笔记保存和分享。部分参考薛毅的《统计建模与R软件》和《R语言实战》本文中分三个方法介绍判别分析,Bayes判别,距离判别,Fisher判别。前两种判别方法都要考虑两个、或多个总体协方差(这里是算方差,方差是协方差的一种)相等或不等的情况,由var.equal=的逻辑参数表示,默认是FALSE,表示认为两总体原创 2017-02-27 17:07:54 · 31178 阅读 · 3 评论 -
R语言生存分析
自己整理编写的R语言常用数据分析模型的模板,原文件为Rmd格式,直接复制粘贴过来,作为个人学习笔记保存和分享。部分参考薛毅的《统计建模与R软件》和《R语言实战》生存分析是研究生存时间的分布规律,以及生存时间和相关因素之间关系的一种统计分析方法。生存分析在医学科学研究中具有广泛而重要的应用价值,它对人群寿命的研究,各种慢性疾病的现场追踪研究,临床疗效试验和动物试验等研究中随访资料的处理骑着举足轻重的作原创 2017-02-27 17:05:43 · 27091 阅读 · 2 评论 -
R语言主成分分析
自己整理编写的R语言常用数据分析模型的模板,原文件为Rmd格式,直接复制粘贴过来,作为个人学习笔记保存和分享。部分参考薛毅的《统计建模与R软件》和《R语言实战》解决自变量之间的多重共线性和减少变量个数根据主成分分析的原理,它一方面可以将k个不独立的指标变量通过线性变换变成k个相互独立的新变量,这是解决多重共线性问题的一个重要方法;另一方面。主成分分析可以用较少的变量取代较多的不独立的原变量,减少分析原创 2017-02-27 17:00:13 · 28294 阅读 · 1 评论 -
R语言典型相关分析
自己整理编写的R语言常用数据分析模型的模板,原文件为Rmd格式,直接复制粘贴过来,作为个人学习笔记保存和分享。部分参考薛毅的《统计建模与R软件》和《R语言实战》1 关键点:典型相关分析典型相关分析是用于分析两组随机变量之间的相关程度的一种统计方法,它能够有效地揭示两组随机变量之间的相互(线性依赖)关系例如 研究生入学考试成绩与本科阶段一些主要课程成绩的相关性将研究两组变量的相关性问题转化为研究两个变原创 2017-02-27 16:40:46 · 25338 阅读 · 4 评论 -
R语言t检验
自己整理编写的R语言常用数据分析模型的模板,原文件为Rmd格式,直接复制粘贴过来,作为个人学习笔记保存和分享。I.单样本t检验例1. 有原始数据的t检验已知某水样中含碳酸钙的真值为20.7mg/L,现用某法重复测定该水样12次,碳酸钙的含量分别为..问该法测定碳酸钙含量所得的均值与诊治有无显著差异?x <- c(20.99,20.41,20.10,20.00,20.91,22.60,20.99,20原创 2017-02-27 16:09:06 · 112815 阅读 · 12 评论 -
R语言因子分析
自己整理编写的R语言常用数据分析模型的模板,原文件为Rmd格式,直接复制粘贴过来,作为个人学习笔记保存和分享。部分参考薛毅的《统计建模与R软件》和《R语言实战》因子模型: X=μ + A*F* + ε 其中F=[(f1,f2,…,fm)]^T为公共因子向量,[ε=(ε1,ε2,…,εp)]^T为特殊因子向量,A=[(aij)]^(p×m)为因子载荷矩阵。I.参数估计为了建立因子模型,需要要得到因原创 2017-02-27 16:31:08 · 21466 阅读 · 1 评论 -
R语言方差分析ANOVA
I. 单因素方差分析#用data frame的格式输入数据medicine <- data.frame( Response=c(7,5,3,1,6,5,3,3,7,9,9,9,4,3,4,3), Treatment=factor(c(rep(1,4),rep(2,4),rep(3,4),rep(4,4))) ) #各组样本大小table(medicine$Treat原创 2017-02-27 16:23:18 · 69939 阅读 · 12 评论 -
R语言关联规则
# Apriori算法实现关联规则挖掘#======================= MODEL1. 输入数据集为transaction类型 ======================#install.packages("arules") #Apriori算法程序包library(arules)data原创 2017-02-27 17:02:38 · 4933 阅读 · 0 评论