数据挖掘
文章平均质量分 93
学渣渣_宇
这个作者很懒,什么都没留下…
展开
-
召回率和准确率的理解
今天看书再一次看到这两个概念,在我印象中原来很努力记忆过一次,效果嘛→显而易见。这一次学聪明点,看懂了就记录下来。首先来讲下二者概念:召回率(recall):是针对我们原来样本而言,表示有多少样本中的正例(一种是把正类预测为正类即TP,一种是把正类预测为负类即FN)被预测正确了。,提取出的正确信息条数 / 样本中的信息条数。精确率(precision):是针对我们的预测结果而言,表示的...原创 2018-07-23 17:10:59 · 21374 阅读 · 1 评论 -
Apriori算法
今天看《python数据分析与挖掘实战》一书中讲到关联规则这块算法,第一次看很懵,自己也花了点时间百度找实例理解。下面记录自己的理解,为了自己复习用。下面写的不是很详细,不懂的概念可以查看我最底下的参考链接。关联规则简单的理解就是从一个数据集中找出满足我们最初给定的最小支持度和最小置信度的所有关联规则。(大于最小的支持度和置信度)。具体实现分为两步:a、生成频繁项集:找出所有满足最小支持度的项...原创 2018-07-18 18:07:47 · 3601 阅读 · 0 评论 -
AR回归模型详解
转:http://geodesy.blog.sohu.com/273714573.html1. 自回归模型的定义 自回归模型(Autoregressive Model)是用自身做回归变量的过程,即利用前期若干时刻的随机变量的线性组合来描述以后某时刻随机变量的线性回归模型[1],它是时间序列中的一种常见形式[2]。2. AR模型的状态空间形式(AR-Process i...转载 2018-07-20 09:46:14 · 31800 阅读 · 0 评论 -
时间序列中的平稳性检验之单位根检验
对序列的平稳性的检验中最常用的方法是单位根的检验。单位根检验是指检查序列中是否存在单位根,如果存在单位根就是非平稳时间序列了。下面是找的解释为什么单位根存在就是非平稳时间序列的原因。作者:五雷链接:https://www.zhihu.com/question/22385598/answer/21221607来源:知乎著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。 ...转载 2018-07-20 15:55:53 · 74123 阅读 · 2 评论 -
AR模型中的自相关系数和偏自相关系数
转:https://blog.csdn.net/WMN7Q/article/details/70174300自相关系数其实自相关系数可以这么理解:把一列数据按照滞后数拆成两列数据,在对这两列数据做类似相关系数的操作。看一个例子:这组数据是求滞后数为2的自相关系数,则变成求{x1,x2,...,x8}和{x3,x4,...,x10}两者的“相关系数”,相关系数打引号是因为这个相关系数的公...转载 2018-07-20 18:08:44 · 51362 阅读 · 0 评论 -
Python时间序列中ADF检验详解
转自:https://pengfoo.com/post/machine-learning/2017-01-24Abstract在ARMA/ARIMA这样的自回归模型中,模型对时间序列数据的平稳是有要求的,因此,需要对数据或者数据的n阶差分进行平稳检验,而一种常见的方法就是ADF检验,即单位根检验。平稳随机过程在数学中,平稳随机过程(Stationary random process...转载 2018-08-01 16:02:35 · 80386 阅读 · 19 评论