machine learning
nancy_princess
win!!
Fighting!!
展开
-
K-均值聚类算法
K-均值聚类算法1. K-均值聚类算法的工作原理:K 均值算法(K-Meansalgorithm)是最常用的聚类算法之一,属于划分聚类方法。对于数据样本集 X={x1,x2,…,xn},n为样本数,设拟划分为 k 个聚类V={v1,v2,…,vk },cj 为vj 的中心,j=1,2,…,k。k均值算法将问题转化为组合优化问题:目标函数为;约束为:(1.1)αij∈{0,1};(1.2);转载 2014-11-02 21:41:27 · 20229 阅读 · 2 评论 -
k-d tree算法
k-d树(k-dimensional树的简称),是一种分割k维数据空间的数据结构。主要应用于多维空间关键数据的搜索(如:范围搜索和最近邻搜索)。应用背景 SIFT算法中做特征点匹配的时候就会利用到k-d树。而特征点匹配实际上就是一个通过距离函数在高维矢量之间进行相似性检索的问题。针对如何快速而准确地找到查询点的近邻,现在提出了很多高维空间索引结构和近似查询的算法,k-d树就是其中一种。转载 2015-05-24 23:19:45 · 1566 阅读 · 0 评论 -
从最大似然到EM算法浅解
从最大似然到EM算法浅解zouxy09@qq.comhttp://blog.csdn.net/zouxy09 机器学习十大算法之一:EM算法。能评得上十大之一,让人听起来觉得挺NB的。什么是NB啊,我们一般说某个人很NB,是因为他能解决一些别人解决不了的问题。神为什么是神,因为神能做很多人做不了的事。那么EM算法能解决什么问题呢?或者说EM算法是因为什么而来到转载 2015-06-01 14:24:16 · 1795 阅读 · 2 评论 -
机器学习 --- 1. 线性回归与分类, 解决与区别
机器学习可以解决很多问题,其中最为重要的两个是 回归与分类。 这两个问题怎么解决, 它们之间又有什么区别呢? 以下举几个简单的例子,以给大家一个概念1. 线性回归回归分析常用于分析两个变量X和Y 之间的关系。 比如 X=房子大小 和 Y=房价 之间的关系, X=(公园人流量,公园门票票价) 与 Y=(公园收入) 之间的关系等等。那么你的数据点在图上可以这么看现在你想转载 2015-05-26 09:17:30 · 1668 阅读 · 0 评论 -
随机过程的参考书籍
我读过的最简单的随机过程当属张波张景肖的《应用随机过程》,清华版,不过马氏过程写的不够详细,这方面最好的当属何声武的《随机过程引论》,写得相当好,简单明白易懂。至于稍微深入一点点的可以看看何书元的《随机过程》,证明除极个别外比较不错,林元烈的《应用随机过程》很是不错,看的很有味。 如果有不懂的条件期望的内容可以参见复旦的《现代概率论基础》,这个有点难度转载 2015-06-09 09:42:36 · 4942 阅读 · 0 评论 -
泊松分布的来源—公式推导—应用
转载请注明出处:一。泊松分布由二项分布引出首先必须由二项分布引出:如果做一件事情成功的概率是 p 的话,那么独立尝试做这件事情 n 次,成功次数的分布就符合二项分布。展开来说,在做的 n 次中,成功次数有可能是 0 次、1 次 …… n次。成功 i 次的概率是:( n 中选出 i 项的组合数) * p ^ i * (1-p)^ (n-i)以上公式很容易推导,用一点概率学最基本的原创 2015-06-08 10:43:54 · 49870 阅读 · 5 评论 -
指数分布的定义形式及应用
转载请注明出处:指数分布是连续型随机变量,指数分布具有无记忆性,指数分布是特殊的gamma分布。指数分布(Exponential distribution)是一种连续概率分布。指数分布可以用来表示独立随机事件发生的时间间隔,比如旅客进机场的时间间隔、中文维基百科新条目出现的时间间隔等等。指数分布的定义形式:指数分布常用来描述“寿命”类随机变量的分布,例如家电使用寿命,动植物原创 2015-06-08 11:24:02 · 33122 阅读 · 0 评论 -
朴素贝叶斯算法matlab实现以及EM算法
这周,继续学习了朴素贝叶斯算法的一部分知识,看了matlab的贝叶斯分类算法。采用草地潮湿原因模型的一个例子来求证贝叶斯概率以及条件概率、联合概率的分析,详见日志http://blog.sina.com.cn/s/blog_6c7b434d01013ufz.html 进而对贝叶斯分类进行研究,采用classify函数进行对训练样本的划分。详见日志http://blog.sina.com.c转载 2015-06-04 15:20:08 · 7728 阅读 · 0 评论 -
聚类算法教程(3):层次聚类算法Hierarchical Clustering Algorithms
基本工作原理给定要聚类的N的对象以及N*N的距离矩阵(或者是相似性矩阵),层次式聚类方法的基本步骤(参看S.C. Johnson in 1967)如下:1. 将每个对象归为一类,共得到N类,每类仅包含一个对象. 类与类之间的距离就是它们所包含的对象之间的距离.2. 找到最接近的两个类并合并成一类,于是总的类数少了一个.3. 重新计转载 2015-05-29 17:18:16 · 2361 阅读 · 0 评论 -
work summary(1)
记录最近工作总结:原创 2015-03-27 15:36:30 · 880 阅读 · 0 评论 -
Hough变换的理解
Hough变换 1,基本思想Hough变换时一种利用图像的全局特征将特定形状边缘链接起来。它通过点线的对偶性,将源图像上的点影射到用于累加的参数空间,把原始图像中给定曲线的检测问题转化为寻找参数空间中的峰值问题。由于利用全局特征,所以受噪声和边界间断的影响较小,比较鲁棒。Hough变换思想为:在原始图像坐标系下的一个点对应了参数坐标系中的一转载 2015-01-20 09:33:22 · 7846 阅读 · 0 评论 -
贪心法与动态规划
胜负未分原创 2014-12-26 11:32:53 · 1243 阅读 · 0 评论 -
最小二乘法详解(线性拟合与非线性拟合)
监督学习中,如果预测的变量是离散的,我们称其为分类(如决策树,支持向量机等),如果预测的变量是连续的,我们称其为回归。回归分析中,如果只包括一个自变量和一个因变量,且二者的关系可用一条直线近似表示,这种回归分析称为一元线性回归分析。如果回归分析中包括两个或两个以上的自变量,且因变量和自变量之间是线性关系,则称为多元线性回归分析。对于二维空间线性是一条直线;对于三维空间线性原创 2014-12-26 10:56:40 · 35157 阅读 · 3 评论