模式识别以及数据挖掘
文章平均质量分 74
little_angel
这个作者很懒,什么都没留下…
展开
-
主元分析PCA原理以及应用
PCA是principal component analysis 的缩写,即主成分分析。此方法目标是找到数据中最主要的元素和结构,去除噪音和冗余,将原有的复杂数据降维,揭露出隐藏在复杂数据背后的简单结构。从线性代数角度来看,PCA目标是找到一组新正交基去重新描述得到的数据空间,这个维度就是主元。 混乱数据中通常包含三种成分:噪音、旋转和冗余。在区分噪音时候,可以使用信噪比或者方差来衡量原创 2012-05-29 21:27:10 · 8815 阅读 · 2 评论 -
特征选择和特征抽取(学习小结)
本篇博客的目的不是深刻的讲解特征提取和特征选择的方法,而是区分清楚他们之间的关系和区别,让大家对特征抽取 特征选择 PCA LDA有个概念框架上的了解,为大家的下一步的深入理解打好基础。 如果我的理解有问题,请大家提出意见,互相交流。 1.特征抽取 V.S 特征选择 特征抽取和特征选择是DimensionalityReduction(降维)的两种方法,针对于the cur原创 2012-06-20 15:31:33 · 16097 阅读 · 0 评论 -
遗传算法
原文地址:http://www.cnblogs.com/heaad/archive/2010/12/23/1914725.html 一.进化论知识 作为遗传算法生物背景的介绍,下面内容了解即可: 种群(Population):生物的进化以群体的形式进行,这样的一个群体称为种群。 个体:组成种群的单个生物。 基因 ( Gene ) :一个遗传因子。 染色体转载 2012-09-06 22:02:42 · 1879 阅读 · 0 评论 -
机器学习中的相似性度量
在做分类时常常需要估算不同样本之间的相似性度量(Similarity Measurement),这时通常采用的方法就是计算样本间的“距离”(Distance)。采用什么样的方法计算距离是很讲究,甚至关系到分类的正确与否。 本文的目的就是对常用的相似性度量作一个总结。本文目录:1. 欧氏距离2. 曼哈顿距离3. 切比雪夫距离4. 闵可夫斯基距离5. 标准化欧氏距转载 2012-09-06 17:00:17 · 720 阅读 · 0 评论 -
模拟退火算法
一. 爬山算法 ( Hill Climbing )介绍模拟退火前,先介绍爬山算法。爬山算法是一种简单的贪心搜索算法,该算法每次从当前解的临近解空间中选择一个最优解作为当前解,直到达到一个局部最优解。爬山算法实现很简单,其主要缺点是会陷入局部最优解,而不一定能搜索到全局最优解。如图1所示:假设C点为当前解,爬山算法搜索到A点这个局部最优解就会停止搜索,因为在A点无论向那个方向小幅度移动都不能转载 2012-09-06 20:32:52 · 723 阅读 · 0 评论