Machine Learning
ustcck
饱暖思淫欲,饥寒起盗心
展开
-
数据分析七种降维方法
http://dataunion.org/20803.html感谢王穆荣的投稿,转载请注明出处:数盟社区近来由于数据记录和属性规模的急剧增长,大数据处理平台和并行数据分析算法也随之出现。于此同时,这也推动了数据降维处理的应用。实际上,数据量有时过犹不及。有时在数据分析应用中大量的数据反而会产生更坏的性能。最新的一个例子是采用 2009 KDD Challenge 大数据转载 2016-11-10 23:05:51 · 3312 阅读 · 0 评论 -
常用降维方法
降维方法分为线性核非线性降维,非线性降维又分为基于核函数和基于特征值的方法。线性降维方法:PCA ICA LDA LFA LPP(LE的线性表示)基于核函数的非线性降维方法:KPCA KICA KDA 基于特征值的非线性降维方法(流型学习):ISOMAP LLE LE LPP LTSA MVULLE(Locally Lin转载 2016-11-13 00:22:11 · 695 阅读 · 0 评论 -
提升分类器准确率的组合方法
分类器提升精确度主要就是通过组合,综合多个分类器结果,对最终结果进行分类。 组合方法主要有三种:装袋(bagging),提升(boosting)和随即森林。装袋和提升方法的步骤:1,基于学习数据集产生若干训练集2,使用训练集产生若干分类器3,每个分类器进行预测,通过简单选举(装袋)或复杂选举(提升),判定最终结果。 如上图所示转载 2016-11-14 11:08:06 · 10161 阅读 · 0 评论 -
数据分析领域中最为人称道的七种降维方法
近来由于数据记录和属性规模的急剧增长,大数据处理平台和并行数据分析算法也随之出现。于此同时,这也推动了数据降维处理的应用。实际上,数据量有时过犹不及。有时在数据分析应用中大量的数据反而会产生更坏的性能。最新的一个例子是采用 2009 KDD Challenge 大数据集来预测客户流失量。 该数据集维度达到 15000 维。 大多数数据挖掘算法都直接对数据逐列处理,在数据数目一大时,导致算法转载 2016-11-13 00:29:44 · 514 阅读 · 0 评论