machine learning
PParis
EE in WHU,CS in ZJU.
展开
-
实现主成分分析和白化
在这一节里,我们将总结PCA, PCA白化和ZCA白化算法,并描述如何使用高效的线性代数库来实现它们。首先,我们需要确保数据的均值(近似)为零。对于自然图像,我们通过减去每个图像块(patch)的均值(近似地)来达到这一目标。为此,我们计算每个图像块的均值,并从每个图像块中减去它的均值。(译注:参见PCA一章中“对图像数据应用PCA算法”一节)。Matlab实现如下:avg = mea转载 2014-04-25 15:35:12 · 827 阅读 · 0 评论 -
关于大数据
早上起来,先背了一个list的单词。原创 2014-04-25 11:32:06 · 484 阅读 · 0 评论 -
PCA主成分分析
摘要: PCA(Principal Component Analysis),称主成分分析,从统计学的角度来说是一种多元统计方法。PCA通过将多个变量通过线性变换以选出较少的重要变量。它往往可以有效地从过于“丰富”的数据信息中获取最重要的元素和结构,去除数据的噪音和冗余,将原来复杂的数据降维,揭示隐藏在复杂数据背后的简单结构。近年来,PCA方法被广泛地运用于计算机领域转载 2014-04-25 15:01:41 · 1252 阅读 · 0 评论 -
怎么解决Underfitting和Overfitting问题?
节选自机器学习如何解决问题-美团技术团队Underfitting数据:清洗数据特征:1. 增加特征2. 删除噪音特征模型:1. 调低正则项的惩罚参数2. 换更“复杂”的模型(如把线性模型换为非线性模型)3. 多个模型级联或组合Overfitting数据:增加数据特征:1. 进行特征选择2. 降维(如对特征进行聚类、原创 2015-06-17 14:09:25 · 6285 阅读 · 0 评论