- 博客(3)
- 资源 (5)
- 收藏
- 关注
原创 时间序列的归一化方法
在机器学习、模式识别的模型训练之前,通常需要对数据进行预处理工作,在哪种情况下选用哪种预处理方法,仍然是很多工作人员比较头疼的事情。本人前面的两篇博客总结了一些比较常用的数据归一化方法:数据预处理之归一化再谈机器学习中的归一化方法这两篇博客介绍的都是针对非时间序列的数据进行的一些常规操作。由于时间序列的特殊性(1、相邻序列之间的模式相关性,2、在时间维度上数据是不断产生的),因
2015-03-30 19:16:42 24956 9
原创 交叉验证(CrossValidation)方法
分类器模型通常在特定的数据上进行训练,由于所得模型可能存在过拟合的现象。因此,模型训练完成之后通常需要进行检验,以验证分类模型在未知数据集上的预测能力,即我们通常所说的“模型泛化”能力。模型的验证是模型在投入使用前的关键步骤,在此收集了当下比较流行的交叉验证技术资料,整理如下,方便查阅和温习:交叉验证(CrossValidation)方法思想简介以下简称交叉验证(Cross Va
2015-03-14 21:38:44 12836
原创 再谈机器学习中的归一化方法(Normalization Method)
机器学习、数据挖掘工作中,数据前期准备、数据预处理过程、特征提取等几个步骤几乎要花费数据工程师一半的工作时间。同时,数据预处理的效果也直接影响了后续模型能否有效的工作。然而,目前的大部分学术研究主要集中在模型的构建、优化等方面,对数据预处理的理论研究甚少,可以说,很多数据预处理工作仍然是靠工程师的经验进行的。从业数据建模/挖掘工作也有近2年的时间,在这里结合谈一谈数据预处理中归一化方法。在之前
2015-03-06 19:49:43 96521 22
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人