模式识别与机器学习
文章平均质量分 74
攻城狮凌风
专业吹水,从不装B
展开
-
Matlab2012a下配置LibSVM—3.18
1.下载最新版LibSVM原创 2014-09-13 19:53:29 · 2243 阅读 · 0 评论 -
数据预处理规则
数据预处理在众多深度学习算法中都起着重要作用。实际情况中,将数据做归一化和白化处理后,很多算法能够发挥最佳效果。但是预处理的精确参数并非显而易见,一般需要尝试。1.数据归一化 数据预处理中标准的第一步是数据归一化。这一步通常视具体情况选择。归一化如下3: 1.简单缩放 2.逐样本均值消减(也称为移除直流分量) 3.原创 2015-01-06 18:42:36 · 3451 阅读 · 0 评论 -
知识点总结(1)
1.序列标注的三种模型 隐马尔可夫模型(Hidden Markov Model,HMM),最大熵马尔可夫模型(Maximum Entropy Markov Model,MEMM)以及条件随机场(Conditional Random Field,CRF)是序列标注中最常用也是最基本的三个模型。 HMM模型是对转移概率和表现概率直接建模,统计共现概原创 2015-07-28 11:28:13 · 622 阅读 · 0 评论 -
核PCA与PCA的精髓和核函数的映射实质
1.PCA遭遇维度危机的时候,进行tezhengxxu2.Kernel-PCA原创 2014-11-06 22:07:13 · 10884 阅读 · 2 评论 -
基于模式识别的的内窥镜肿瘤检测
1.主要目标 (1) 在小波域下的肿瘤病变息肉诊断,辅助医疗2.小波域下的彩色肿瘤息肉诊断 目标:一些彩色内窥镜结肠息肉图片(128*128)。 方法:二阶小波变换获得彩色通道(在rgb,xyz,xyY,CIE-lab,HSV三个通道下进行测试)的灰度共生矩阵,基于三个通道的灰度共生矩阵获得72维的协方差向原创 2015-07-21 15:25:52 · 1059 阅读 · 1 评论 -
支撑矢量机SVM
1.线性SVM2.核SVM3.总结原创 2015-08-24 14:34:37 · 1008 阅读 · 0 评论 -
KNN算法
1.算法思想 K最近邻(k-Nearest Neighbor,KNN)分类算法,是一个理论上比较成熟的有监督方法,也是最简单的机器学习算法之一。该方法的思路是:如果一个样本在特征空间中的k个最相似(即特征空间中最邻近)的样本中的大多数属于某一个类别,则该样本也属于这个类别。 该方法在定类决策上只依据最邻近的一个或者几个样本的类别来决定待分样本所属的类别。原创 2015-09-04 21:06:51 · 2069 阅读 · 0 评论 -
Kmeans
1.基本思想 聚类属于无监督学习,以往的回归、朴素贝叶斯、SVM等都是有类别标签y的,也就是说样例中已经给出了样例的分类。而聚类的样本中却没有给定y,只有特征x,比如假设宇宙中的星星可以表示成三维空间中的点集。聚类的目的是找到每个样本x潜在的类别y,并将同类别y的样本x放在一起。比如上面的星星,聚类后结果是一个个星团,星团里面的点相互距离比较近,星团间的星星距离就比较远了。原创 2015-09-04 16:36:39 · 688 阅读 · 0 评论 -
朴素贝叶斯
先上问题吧,我们统计了14天的气象数据(指标包括outlook,temperature,humidity,windy),并已知这些天气是否打球(play)。如果给出新一天的气象指标数据:sunny,cool,high,TRUE,判断一下会不会去打球。table 1outlooktemperaturehumiditywind转载 2015-09-14 21:04:28 · 1129 阅读 · 0 评论 -
逻辑回归
本栏目(Machine learning)包括单参数的线性回归、多参数的线性回归、Octave Tutorial、Logistic Regression、Regularization、神经网络、机器学习系统设计、SVM(Support Vector Machines 支持向量机)、聚类、降维、异常检测、大规模机器学习等章节。所有内容均来自Standford公开课machine learning转载 2015-09-15 10:47:21 · 714 阅读 · 0 评论 -
机器学习概览之常见算法汇总
机器学习无疑是当前数据分析领域的一个热点内容。很多人在平时的工作中都或多或少会用到机器学习的算法。这里IT经理网为您总结一下常见的机器学习算法,以供您在工作和学习中参考。 机器学习的算法很多。很多时候困惑人们都是,很多算法是一类算法,而有些算法又是从其他算法中延伸出来的。这里,我们从两个方面来给大家介绍,第一个方面是学习的方式,第二个方面是算法的类似性。学习方式转载 2015-01-08 17:58:45 · 1008 阅读 · 0 评论 -
斯坦福机器学习课程笔记(第五讲)
转载请注明:http://blog.csdn.net/xinzhangyanxiang/article/details/9285001该系列笔记1-5pdf下载请猛击这里。本篇博客为斯坦福ML公开课第五个视频的笔记,主要内容包括生成学习算法(generate learning algorithm)、高斯判别分析(Gaussian DiscriminantAnalysis,GDA)、转载 2014-10-21 22:15:34 · 845 阅读 · 0 评论 -
机器学习中的相似性度量
在做分类时常常需要估算不同样本之间的相似性度量(Similarity Measurement),这时通常采用的方法就是计算样本间的“距离”(Distance)。采用什么样的方法计算距离是很讲究,甚至关系到分类的正确与否。 本文的目的就是对常用的相似性度量作一个总结。本文目录:1. 欧氏距离2. 曼哈顿距离3. 切比雪夫距离4. 闵可夫斯基距离5. 标准化欧氏距转载 2014-09-16 09:40:57 · 814 阅读 · 0 评论 -
几种常见模式识别算法整理和总结
这学期选了门模式识别的课。发现最常见的一种情况就是,书上写的老师ppt上写的都看不懂,然后绕了一大圈去自己查资料理解,回头看看发现,Ah-ha,原来本质的原理那么简单,自己一开始只不过被那些看似formidable的细节吓到了。所以在这里把自己所学的一些点记录下来,供备忘,也供参考。 1. K-Nearest NeighborK-NN可以说是一种最直接的用来分类未转载 2014-09-17 20:31:01 · 1369 阅读 · 1 评论 -
计算机视觉和机器学习,代码,论文大全
一、特征提取Feature Extraction:· SIFT [1] [Demo program][SIFT Library] [VLFeat]· PCA-SIFT [2] [Project]· Affine-SIFT [3] [Project]· SURF [4] [OpenSURF] [M转载 2014-10-23 22:35:57 · 1354 阅读 · 0 评论 -
常见的的样本数据归一化
数据的标准化(normalization)是将数据按比例缩放,使之落入一个小的特定区间。在某些比较和评价的指标处理中经常会用到,去除数据的单位限制,将其转化为无量纲的纯数值,便于不同单位或量级的指标能够进行比较和加权。 其中最典型的就是数据的归一化处理,即将数据统一映射到[0,1]区间上,常见的数据归一化的方法有:min-max标准化(Min-max normalization)原创 2014-10-24 11:28:45 · 9805 阅读 · 0 评论 -
线性判别分析LDA详解
一年前就研究过Fisher线性判别分析,到现在又忘得差不多了,在此特总结一下:1、线性判别分析是统计学上的一种分析方法,用于在已知的分类之下遇到有新的样本时,选定一个判别标准,以判定如何将新样本放置于哪一个类别之中。主要用于二分类问题,对于多类问题则可以多次运用该方法就可以了;2、Fisher线性判别分析的主要原理是将带有类别标签的高维样本投影到一个向量w(一维空间)上,使得在该向原创 2014-10-08 22:38:18 · 8269 阅读 · 1 评论 -
LDA与最小二乘法的关系及其变种详解
1 LDA与最小二乘法的关系2.LDA的变种详解原创 2014-10-09 21:33:41 · 1650 阅读 · 0 评论 -
机器学习模式识别数据挖掘数据集下载链接
Ranking:【1】MovieLens Data Sets http://www.grouplens.org/node/12【2】Yahoo! Learning to Rank Challenge http://learningtorankchallenge.yahoo.com/datasets.php【3】LETOR: Learning to Rank for Info原创 2014-10-29 21:05:36 · 5736 阅读 · 0 评论 -
特征降维之SVD分解
奇异值分解。特征值分解是一个提取矩阵特征很不错的方法,但是它只是对方阵而言的,在现实的世界中,我们看到的大部分矩阵都不是方阵,比如说有N个学生,每个学生有M科成绩,这样形成的一个N * M的矩阵就不可能是方阵,我们怎样才能描述这样普通的矩阵呢的重要特征呢?奇异值分解可以用来干这个事情,奇异值分解是一个能适用于任意的矩阵的一种分解的方法: 假设A是一个N * M的矩阵,那么得到的U原创 2014-10-14 15:42:13 · 5937 阅读 · 0 评论 -
Levenberg-Marquardt优化算法以及基于LM的BP-ANN
什么是最优化?Levenberg-Marquardt算法是最优化算法中的一种。最优化是寻找使得函数值最小的参数向量。它的应用领域非常广泛,如:经济学、管理优化、网络分析 、最优设计、机械或电子设计等等。根据求导数的方法,可分为2大类。第一类,若f具有解析函数形式,知道x后求导数速度快。第二类,使用数值差分来求导数。根据使用模型不同,分为非约束最优化、约束最优化、最小二乘最优化。原创 2014-10-18 22:22:12 · 8648 阅读 · 2 评论 -
机器学习算法之旅
在理解了我们需要解决的机器学习问题之后,我们可以思考一下我们需要收集什么数据以及我们可以用什么算法。本文我们会过一遍最流行的机器学习算法,大致了解哪些方法可用,很有帮助。机器学习领域有很多算法,然后每种算法又有很多延伸,所以对于一个特定问题,如何确定一个正确的算法是很困难的。本文中我想给你们两种方法来归纳在现实中会遇到的算法。学习方式根据如何处理经验、环境或者任何我们称之为转载 2014-10-20 20:08:10 · 944 阅读 · 0 评论 -
机器学习算法思想梳理
朴素贝叶斯: 有以下几个地方需要注意: 1. 如果给出的特征向量长度可能不同,这是需要归一化为通长度的向量(这里以文本分类为例),比如说是句子单词的话,则长度为整个词汇量的长度,对应位置是该单词出现的次数。 2. 计算公式如下: 其中一项条件概率可以通过朴素贝叶斯条件独立展开。要注意一点就是 的计算方法,而由朴素贝叶斯的前提假设可知, = ,因转载 2015-09-15 10:12:35 · 893 阅读 · 0 评论