R in Action
文章平均质量分 75
Lang Grass
这个作者很懒,什么都没留下…
展开
-
Rstudio快捷键
控制台 功能 Windows & Linux Mac移动鼠标到控制台Ctrl+2 Ctrl+2控制台清屏Ctrl+L Command+L移动鼠标至第一行Home Command+Left移动鼠标至最后一行End Command+Right历史记录翻滚Up/Down Up/Down弹出历史记录栏Ctrl+Up Command+Up终...转载 2018-10-28 22:09:00 · 1428 阅读 · 0 评论 -
R教材7 方差分析
方差分析:组间差别分析aov(formula,data),将组别因子加入到函数 双因素方差分析中,若不同的分组中组内观测数不同则模型的顺序具有唯一性;ANOVA模型的顺序很重要,模型Y~A+B+A:B,其中Y为因变量,A,B为分组量 序贯型:后面对线出现的效应做调整,A不调整,B根据A调整,A:B交互项根据A和B调整 分层型:根据同水平或低水平的效应调整,A根据B调整,B根据A调整,A:B...原创 2018-10-26 08:45:44 · 574 阅读 · 0 评论 -
R教材6 回归
大部分情况下,我们用OLS(最小二乘法)来得出回归模型 lm(formula,data)拟合回归模型,data是数据框 y~x,左边为响应变量,右边为解释变量;+分隔预测变量 :表示交互项,x:y *表示所有可能交互项的简洁方式,x*z=x+z+x:z ^表示交互达到某个次数,(x+z+w)^2=x+z+w+x:z+x:w+z:w .表示出因变量外的所有变量,不包含自变量间的交...原创 2018-10-26 08:45:29 · 451 阅读 · 0 评论 -
R教材5 统计
summary(),统计描述,因子向量和逻辑向量的频数统计,包括缺失值统计,同样作用的有 Hmisc包中的describe() pastecs包中的stat.desc() psych包中的describe() 多个包中有相同名的函数,运行最后载入的,可用包名::函数()来使用 分组计算描述性统计量 aggregate(x,by,FUN),单返回值函数 by(x,indic...原创 2018-10-26 08:45:12 · 241 阅读 · 1 评论 -
R教材4 高级数据管理
数值与字符处理函数 数学函数,对象非单个数值时,会作用于每个数值 绝对值abs() 平方根sqrt() 舍入小数round(,digits=) 对数 log(x,base=n)以n为底 log()以e为底 log10()以10为底 指数exp(x),以e为底指数 统计函数na.rm=T,计算时移除NA;trim=0.05,去除...原创 2018-10-26 08:44:57 · 136 阅读 · 0 评论 -
R教材3 数据管理
根据原对象创建新变量,对象=transform(对象,新变量) 变量的重编码variable[condition]<-expression,变量的下标运算符设置条件,当condition为T时则执行赋值;within(对象,{新变量[原变量的判断条件]=新值}),创建新对象,{}内为执行语句 cut(列对象,breaks=quantile(列对象,probs=c(0.0,0.3,0.7,...原创 2018-10-26 08:44:35 · 133 阅读 · 0 评论 -
R教材2&19&23 图形初阶&ggplot2&lattice&ggiraph&plotly
设置基础图形参数 par()设置图形特征,直到会话结束 opar<-par(no.readonly=T)……par(opar),将默认图形属性保存,在修改图形属性的作图后,恢复默认值 par(mfrow=c(1,1))设置画板分隔成1*1的等大区域 符号和线条 pch=1|2|3|......点的符号(形状) cex点的形状的大小,默认为1...原创 2018-10-24 00:20:09 · 521 阅读 · 0 评论 -
R教材1
R是一种区分大小写的解释型语言;一个对象可以是任何能被赋值的东西,对于R来说对象可以是数据、函数、图形、分析结果等等,每个对象有一个类属性,可以告诉R如何处理数据,对象都拥有某种模式,描述此对象是如何存储的 R语句由函数和赋值构成,使用<-赋值,注释由#开头;了解R能够做出什么图形,用demo() 工作空间:是R当前的环境,setwd(),存储着定义的对象和数据.RData,下次直接打开...原创 2018-10-24 00:19:37 · 181 阅读 · 0 评论 -
R教材11.2 随机森林与支持向量机
随机森林是组成式监督学习算法,同时使用多个预测模型,将模型的结果汇总以提升分类准确率;对样本单元和属性进行抽样,产生大量的决策树,再对检验的样本单元进行依次分类,从而得到未知样本单元的类 算法:训练集中有N个样本单元,M个变量 从训练集中随机有放回的抽取N个样本单元 对于抽取出的训练集,对每个节点随机抽取m<M个变量,作为分割该节点的候选变量,每一个节点处的变量数应该一致 ...原创 2018-10-28 22:10:46 · 2477 阅读 · 0 评论 -
R教材11.1 分类与决策树
分类目的:根据一组预测变量来预测相对应的分类结果,实现对新出单元的准确分类 有监督学习:基于已知类的数据样本,将全部数据分为训练集和验证集 用到的包:rpart,rpart.plot,party,randomForest,e1071 随机抽样: set.seed(1234) sample(nrow(对象),present*nrow(对象)),结果是抽样的内置ID sample(数据...原创 2018-10-28 22:10:31 · 506 阅读 · 0 评论 -
R教材10 聚类分析
营销研究人员根据消费者的人口统计特征和购买行为的相似性制定客户细分战略 聚类的一般步骤: 选择对聚类结果有效的数据 对每个变量标准化:z分数scale(),分位数或(x-μ)/平均绝对偏差;变量间数值差距较大时必须标准化 寻找异常点并去除(或研究): outliers包中有筛选单变量离群点的函数 mvoutlier包中有筛选多元变量离群点的函数 计算距离?dist,...原创 2018-10-28 22:09:48 · 985 阅读 · 0 评论 -
R教材8 功效分析
在给定置信度下,判断检测到给定值时所需要的样本量;也能计算在某样本量内能检测到给定效应值的概率 功效是1-二类错误,1-β,看做真实效应发生的概率 效应值是在备选或研究假设下效应的量 对于每个函数,用户设定(样本大小n,显著性水平α,功效,效应值)中的三个量,第四个量可以计算出来 功效分析函数 t检验:pwr::pwr.t.test(n,d,sig.level,power,typ...原创 2018-10-26 08:46:00 · 862 阅读 · 0 评论