![](https://img-blog.csdnimg.cn/20201014180756780.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
机器学习
文章平均质量分 88
MGRsilicon
这个作者很懒,什么都没留下…
展开
-
Cluster Analysis:聚类分析
Cluster Analysis:聚类分析 Cluster analysis或者Clustering的任务是将对象集合分组,使其成为由类似的对象组成的多个类别的过程。Cluster分组的依据是对象数据的自身信息和对象数据之间的关系;分组目标是将当前Cluster中的数据跟其他簇中的数据最大程度上的区别开来。簇内的相似度越高,组件的差异性越大,分簇的效果越好。聚类分析的目标就是在相似...原创 2013-03-01 22:38:42 · 1183 阅读 · 0 评论 -
机器学习书目推荐
机器学习书目推荐 决策树的重要性和入门可以参考前面两篇文章:在清华水木上有个Machine Learning的书单: http://www.newsmth.net/nForum/#!article/AI/34859 其中作为入门的几本书也不简单,都是经典的作品PRML或者是最新的著作(ML-APP),这些书在网上都能找到,不过找到不过不看放在硬盘里的话,其实这些书对你的用...原创 2013-04-21 18:04:56 · 208 阅读 · 0 评论 -
Decision Tree:CART、剪枝
Decision Tree:CART、剪枝 决策树的重要性和入门可以参考前面两篇文章,尤其是入门的ID3算法:http://isilic.iteye.com/blog/1841339、http://isilic.iteye.com/blog/1844097Classification And Regression Tree(CART)也是决策树的一种,并且是非常重要的决策树。除...原创 2013-04-13 11:48:27 · 433 阅读 · 0 评论 -
Decision Tree:ID3、C4.5
Decision Tree:ID3、C4.5 ID3(Iterative Dichotomiser 3)算法是判定树算法(Decision Tree Learning)的典型代表算法,由Ross Quinlan在1975年提出。ID3是作为C4.5的先驱,在Machine Learning和Natural Language Processing中使用广泛。该分类算法的核心是Entrop...原创 2013-04-08 21:18:07 · 206 阅读 · 0 评论 -
Decision Tree:Analysis
Decision Tree:Analysis 大家有没有玩过猜猜看(Twenty Questions)的游戏?我在心里想一件物体,你可以用一些问题来确定我心里想的这个物体;如是不是植物?是否会飞?能游泳不?当你问完这些问题后,你就能得到这个物体的特征,然后猜出我心里想象的那个物体,看是否正确。这个游戏很简单,但是蕴含的思想却是质朴的。每个问题都会将范围减少,直到特征显现,内蕴的思想...原创 2013-04-03 11:53:22 · 243 阅读 · 0 评论 -
k Nearest Neighbor Algorithm
k Nearest Neighbor Algorithm k Nearest Neighbor(kNN) algorithm算法和k-Means算法一样,都是简单理解,但是实际效果出人意料的算法之一。正式由于其算法思想简单,很多人可能会认为在工程中用途有限,实际上kNN和k-Means两种算法正是凭借其算法思想入选 Top Ten Data Mining Algorithm(http:...原创 2013-03-28 20:22:04 · 211 阅读 · 0 评论 -
Regression:Logistic Regression Analysis
Regression:Logistic Regression Analysis Linear Regression在处理数据输入和数据输出的线性关系上非常有用,但是还是有很多情况,如数据输出空间为R且连续,如果处理的数据离散、输出为二分类(Binary,{0,1})时,LR就不合适处理这宗数据模型,准确的说不是最优(Optimal)处理数据的方法。在这种数据模型下,Logistic ...原创 2013-03-24 23:51:28 · 378 阅读 · 0 评论 -
Regression:Linear Regression Analysis
Regression:Linear Regression Analysis 这次我们来学习线性回归模型(Linear Regression Model),线性回归是一种简单的停机模型。最简单直观的概念就是输入X和输出Y为线性关系;尽管关系简单,但是对于后来的学习非常重要。我们前面已经学习过基本概念,有输入数据X,输出数据Y,待估计变量W,则线性模型可以表示为: 其中的误差表示符...原创 2013-03-23 12:44:18 · 489 阅读 · 0 评论 -
Regression Analysis
Regression Analysis Regression Analysis是一种用来估计变量之间关系的统计技术,请注意估计、变量、统计等关键词;用用统计学知识,对于隐含变量进行处理,估计数据间的关系就叫Regression Analysis。 有很多中建模技术都用来解决回归问题,如单变量和多变量、变量独立和变量相关、线性统计和非线性统计、连续和离散、参数和非参数模型等...原创 2013-03-20 18:12:08 · 324 阅读 · 0 评论 -
k-d tree
k-d tree k-d树(k-dimensional tree)是一种空间数据分割结构,对于组织在d维空间的数据进行搜索,典型的应用如范围搜索(Range Search)和最邻近搜索(Nearest Search)。这两个术语有没有感觉很熟悉,在机器学习Clustering算法中经常用到这两个功能,如DBSCAN、OPTICS等算法。在使用Range Query和Nearest ...原创 2013-03-18 19:09:22 · 184 阅读 · 0 评论 -
Clustering:Gaussian Mixture Model and Expectation Maximization
Clustering:Gaussian Mixture Model and Expectation Maximization 在统计学中,Mixture Model是个概率模型,利用概率密度来对数据分簇,当然Mixture Model不只是可以用来分簇,只是我们在这里使用Mixture Model来进行分簇,借此来学习这个概率模型。Mixture Model通常和概率分布(P...原创 2013-03-16 22:27:23 · 294 阅读 · 0 评论 -
Clustering:Model-Based Algorithm
Clustering:Model-Based Algorithm 我们在前面学习过的Clustering算法模型有:基于划分(Partitioning):K-Means及其扩展算法基于层次(Hierarchical):Hierarchical Cluster算法这两类算法能够在大多数常规数据空间中运行良好,但是其缺点也是比较明显。数据本身的特性,如欧式空间限制、初始值限制等...原创 2013-03-13 23:47:51 · 1140 阅读 · 0 评论 -
Clustering:K-means Extention
Clustering:K-means Extention 在上篇K-Means介绍中,学习了K-means算法的优点和缺点。本文通过扩展K-Means算法来进一步学习Clustering的相关算法。在K-Means算法中,使用的距离概念是欧式距离,这个必须在欧式空间中才有效。这个对数据的要求比较高,如果不能使用欧式空间内的距离(Distance)来描述数据点之间的差异(Dis...原创 2013-03-10 11:30:15 · 185 阅读 · 0 评论 -
Cluster:Hierarchical Clustering
Cluster:Hierarchical Clustering 上次学习了K-Means算法之后,本次继续学习另外一种Clustering算法:Hierarchical Clustering算法。Hierarchical Clustering分簇技术在Clustering方法中也是很重要的,其历史比较久远,和K-means一样。尽管如此,这两种算法仍然广泛使用,算是Clustering...原创 2013-03-07 21:54:23 · 401 阅读 · 0 评论 -
Cluster:K-means Algorithm
Cluster:K-means Algorithm K-means算法算是Clustering算法中最为简单的算法了,我们从最简单的算法开始学习。K-means的算法思路很简单,根据算法名字所描述的那样,K是系统的输入参数,表明我们想分簇的数量;首先随机选择K个初始点作为中心点(Centroid),再将每个数据点赋给离其最近的簇,然后更新簇的中心点;直到中心点不再变化为止。 ...原创 2013-03-06 18:41:57 · 214 阅读 · 0 评论 -
Distance And Dissimilarity
Distance And Dissimilarity 本文收集的用来描述空间距离的公式。注意有些并不能称为是Distance,因其不满足欧式空间的不等式特性;但是这些公式在某些程度上也描述了空间中向量的差异性,所以被称为是Dissimilarity。本文暂不区分Distance和Dissimilarity,统一用Distance看待,方便描述;各位看官心中要有这些区分。 对于空...原创 2013-02-28 22:26:16 · 284 阅读 · 0 评论