R语言
满腹的小不甘
这个作者很懒,什么都没留下…
展开
-
R语言:异常数据处理
前言 在数据处理中,尤其在作函数拟合时,异常点的出现不仅会很大程度的改变函数拟合的效果,而且有时还会使得函数的梯度出现奇异梯度,这就导致算法的终止,从而影响研究变量之间的函数关系。为了有效的避免这些异常点造成的损失,我们需要采取一定的方法对其进行处理,而处理的第一步便是找到异常点在数据中的位置。 什么是异常值?如何检测异常值?目录 1. 单变量异常值检测 2. 使用LOF(...转载 2019-06-05 14:36:42 · 7434 阅读 · 0 评论 -
预测方法论:预测流程
编辑中。。。 预测是个复杂的过程,需要不同角色的人参与,因此,制订用于指导预测工作开展的流程至关重要。预测基本流程参照了 CRISP-DM标准过程及数据分析的常见步骤,按照笔者从事预测工作多年的经验整合而成,详见下图。从确定预测主题开始,依次进行收集数据、选择方法分析规律、建立模型、评估效果直到发布模型。 需要注意的是选择方法和分析规律之间是可逆箭头,如果没找到...原创 2019-06-17 16:52:33 · 1658 阅读 · 0 评论 -
R语言:预测算法常用包总结
R语言用于预测的算法常见包总结如下:原创 2019-06-17 16:34:16 · 2801 阅读 · 0 评论 -
R语言:summary()函数解读
summary():获取描述性统计量,可以提供最小值、最大值、四分位数和数值型变量的均值,以及因子向量和逻辑型向量的频数统计等。结果解读如下:1. 调用:Call2. 残差统计量:Residuals3. 系数:Coefficients4. Multiple R-squared和Adjusted R-squared5. F-statistic1. 调用:C...转载 2019-06-17 16:08:54 · 120358 阅读 · 13 评论 -
R语言:常用函数总结
1.range()函数:返回一个向量,该向量包含给定参数的最大值和最小值。range(..., na.rm = FALSE, finite = FALSE)参数... 任意数值型或字符型对象 na.rm NA值被丢弃 finite 把不是有限的元素丢弃 2. cooks.distance():异常点诊断(...原创 2019-06-16 16:30:10 · 3278 阅读 · 0 评论 -
R语言:plot()函数参数合集
参考:R语言基础备忘-plot()详解最近用R语言画图,plot 函数是用的最多的函数,而他的参数非常繁多,由此总结一下,以供后续方便查阅。plot(x, y = NULL, type = "p", xlim = NULL, ylim = NULL, log = "", main = NULL, sub = NULL, xlab = NULL, ylab = NULL,ann = par...转载 2019-06-20 14:07:20 · 9760 阅读 · 0 评论 -
R语言:na.fail和na.omit
实际工作中,数据集很少是完整的,许多情况下样本中都会包括若干缺失值NA,这在进行数据分析和挖掘时比较麻烦。R语言通过na.fail和na.omit可以很好地处理样本中的缺失值。na.fail(<向量a>): 如果向量a内包括至少1个NA,则返回错误;如果不包括任何NA,则返回原有向量a na.omit(<向量a>): 返回删除NA后的向量a att...转载 2019-06-10 11:32:45 · 20968 阅读 · 0 评论 -
R语言:cbind()和rbind()
可以利用函数cbind() 和rbind() 把向量和矩阵拼成一个新的矩阵。概略地说,cbind() 把矩阵横向合并成一个大矩阵(列方式),而rbind()是纵向合并(行方式)。cbind: 根据列进行合并,即叠加所有列,m列的矩阵与n列的矩阵cbind()最后变成m+n列,合并前提:cbind(a, b)中矩阵a、b的行数必需相符 rbind: 根据行进行合并,就是行的叠加,...原创 2019-06-10 11:28:57 · 77371 阅读 · 0 评论 -
R语言:rep函数解析
函数形式:rep(x, time = , length = , each = ,)参数说明:x:代表的是你要进行复制的对象,可以是一个向量或者是一个因子。 times:代表的是复制的次数,只能为正数。负数以及NA值都会为错误值。复制是指的是对整个向量进行复制。 each:代表的是对向量中的每个元素进行复制的次数。 length.out:代表的是最终输出向量的长度。示例:r...原创 2019-06-10 11:11:44 · 107513 阅读 · 1 评论 -
R语言:绘图函数
不断补充。。。plot()和points()区别:plot是高级作图函数,points是低级作图函数,通常是先用高级作图函数把图的框架定下来,然后用低级作图函数对已有的框架进行修饰。plot():points():R语言低级绘图函数-pointshttps://www.cnblogs.com/xudongliang/tag/R%E8%AF%AD%E8%A8%80/defau...原创 2019-06-19 14:43:48 · 2616 阅读 · 0 评论 -
R语言:expand.grid() 函数解析
expand.grid() 构造一个数据框,将各参数的各水平完全搭配。示例: type=c("A", "M") trend=c("N","A", "M") seasonal=c("N","A","M") hw_grid <- expand.grid(type,trend,seasonal) print(hw_grid) ...原创 2019-06-06 11:16:21 · 15443 阅读 · 0 评论 -
R语言:paste函数解析
paste函数 paste (..., sep = " ", collapse = NULL) paste0(..., collapse = NULL)参数说明:...-表示要组合的任何数量的参数。 sep-表示参数之间的分隔符。它是任选的。 collapse-用于消除两个字符串之间的空间。但不是在一个字符串的两个词的空间。 p...原创 2019-06-06 10:56:44 · 10961 阅读 · 0 评论 -
时间序列预测之一:指数平滑法(二)R语言——代码实现
参考:https://www.cnblogs.com/fengzzi/p/10044426.html指数模型是用来预测时序未来值的最常用模型。这类模型相对比较简单,但是实践证明它们的短期预测能力较好。不同指数模型建模时选用的因子可能不同。比如单指数模型(simple/single exponential model)拟合的是只有常数水平项和时间点i处随机项的时间序列,这时认为时间序列不...转载 2019-06-06 10:34:31 · 10879 阅读 · 1 评论 -
R语言:时间序列常用函数
时序分析会用到的函数函数 程序包 用途 ts() stats 生成时序对象 plot() graphics 画出时间序列的折线图 start() stats 返回时间序列的开始时间 end() stats 返回时间序列的结束时间 frequency() stats 返回时间序列中时间点的个数 win...原创 2019-06-06 10:36:26 · 6308 阅读 · 0 评论 -
R语言:ts() 时间序列的建立
ts() 函数: 通过一向量或者矩阵创建一个一元的或多元的时间序列(time series),为ts型对象。调用格式: ts(data = NA, start = 1, end = numeric(0), frequency = 1, deltat = 1, ts.eps = getOption("ts.eps"), class, names)说明:...原创 2019-06-05 15:16:09 · 54493 阅读 · 6 评论 -
R语言笔记-sample()函数
在医学统计学或者流行病学里的现场调查、样本选择经常会提到一个词:随机抽样。随机抽样是为了保证各比较组之间均衡性的一个很重要的方法。那么今天介绍的第一个函数就是用于抽样的函数sample:> x=1:10> sample(x=x) [1] 3 5 9 6 10 7 2 1 8 4第一行代码表示给x向量赋值1~10,第二行代码表示对x向量进行随机抽样。结...转载 2019-06-25 14:10:35 · 22726 阅读 · 3 评论