R——常见问题
Distrlili
这个作者很懒,什么都没留下…
展开
-
时间序列的总结
总结工作中用到的时间序列相关内容。1、指数平滑的理论指数平滑R实践# 基础包里的函数HoltWinters()# 非季节性简单指数平滑 — models level(即上面简单指数平滑法)fit <- HoltWinters(myts, beta=FALSE, gamma=FALSE)# 非季节性性趋势模型 - models level and trendfit <- ...原创 2020-03-04 23:49:19 · 1074 阅读 · 0 评论 -
缺失值NA的影响
最近学习logistic回归模型时,其中一步构造回归设计矩阵(mode.matrix)时遇到麻烦,现总结重点:1.解释变量的数据类型是连续型还是离散型,离散型的需要弄清楚各个水类的个数,防止出现NA水平,改变了数据的长度;”’{r}”’原创 2016-10-11 09:42:24 · 1355 阅读 · 0 评论 -
Rstudio中出现中文乱码
Rstudio打开含有中文的文件,出现乱码的解决方法:1.设置RStudio的默认编码 RStudio菜单栏的Tools -> Global Options2.选择General -> Default Text Encoding,点击Change:3.在弹出的编码中,选择UTF-8编码。原创 2016-09-22 09:59:19 · 13973 阅读 · 3 评论 -
回归分析中的多重共线性问题
最近做回归分析,出现了相关系数与回归方程系数符号相反的问题,经过研究,确认是多重共线性问题并探索了解决方法。在此将多重共线性的相关知识整理如下。解释变量理论上的高度相关与观测值高度相关没有必然关系,有可能两个解释变量理论上高度相关,但观测值未必高度相关,反之亦然。所以多重共线性本质上是数据问题。造成多重共线性的原因有一下几种:1、解释变量都享有共同的时间趋势;2、一个解释变量是另一个的滞后,二者往往转载 2016-12-10 10:52:22 · 20648 阅读 · 0 评论 -
判别系数的通俗理解
1.可决系数R^2的通俗理解 对于一元线性回归,R2就是简单相关系数的平方;对于多元线性回归,R2是复相关系数的平方。复相关系数实际上就是y和fitted(y)的简单相关系数。 1.read.table(“clipboard”, header = FALSE,fill = TRUE, blank.lines.skip = FALSE) 若想保留csv文件中的空白行,参数fill和bla原创 2016-12-26 17:34:02 · 1860 阅读 · 0 评论 -
线性回归的正态性检验及其诊断问题
单变量正态检验主要的话包括以下这些 shapiro.test();#Shapiro-Wilk检验 ,样本量小于5000 ks.tyest();#Kolmogorov-Smirnov检验,可用于大样本但是要求样本中不能出现相同的值library(“nortest”); lillie.test() #Kolmogorov-Smirnov检验 ad.test() #Anderson-Darling原创 2016-12-26 17:37:00 · 5907 阅读 · 0 评论 -
交叉检验的实现
在k重交叉验证中,样本被分为k个子样本,轮流将k–1个子样本组合作为训练集,另外1个子样本作为保留集。这样会获得k个预测方程,记录k个保留样本的预测表现结果,然后求其平均值。(当n是观测总数目,且k为n时,该方法又称作刀切法,jackknifing。)目前实现了交叉检验的两种实现方法: 1.boot包里的cv.glm()函数 主要用来做广义线性模型的交叉验证,一般与glm()函数一起使用。原创 2016-12-26 18:56:16 · 2893 阅读 · 0 评论