机器学习
kitty.wang
这个作者很懒,什么都没留下…
展开
-
机器学习一:邻近算法【K最近邻(KNN,k-NearestNeighbor)分类算法】python代码实现KNN
理论内容请参看博客:https://blog.csdn.net/weixin_41676798/article/details/90454618"""数据分类-knn算法:1)计算测试数据与各个训练数据之间的距离;2)按照距离的递增关系进行排序;3)选取距离最小的K个点;4)确定前K个点所在类别的出现频率;5)返回前K个点中出现频率最高的类别作为测试数据的预测分类。本代码场景:根据...原创 2019-05-24 18:26:45 · 445 阅读 · 0 评论 -
机器学习一:邻近算法【K最近邻(kNN,k-NearestNeighbor)分类算法】
所谓K最近邻,就是k个最近的邻居的意思,说的是每个样本都可以用它最接近的k个邻居来代表。kNN算法的核心思想:如果一个样本在特征空间中的k个最相邻的样本中的大多数属于某一个类别,则该样本也属于这个类别,并具有这个类别上样本的特性。该方法在确定分类决策上只依据最邻近的一个或者几个样本的类别来决定待分样本所属的类别。下图中,绿色圆要被决定赋予哪个类,是红色三角形还是蓝色四方形?如果K=3,由于红...转载 2019-05-22 23:48:22 · 1364 阅读 · 0 评论 -
机器学习二:K均值聚类算法(k-means clustering algorithm)
k均值聚类算法是一种迭代求解的聚类分析算法,其步骤是随机选取K个对象作为初始的聚类中心,然后计算每个对象与各个种子聚类中心之间的距离,把每个对象分配给距离它最近的聚类中心。聚类中心以及分配给它们的对象就代表一个聚类。每分配一个样本,聚类的聚类中心会根据聚类中现有的对象被重新计算。这个过程将不断重复直到满足某个终止条件。终止条件可以是以下其中一个:1) 没有(或最小数目)对象被重新分配给不同...转载 2019-05-22 23:55:24 · 6152 阅读 · 0 评论 -
机器学习三:贝叶斯定理
贝叶斯定理是用来描述两个条件概率之间的关系,比如 P(A|B) 和 P(B|A)。按照乘法法则,可以立刻导出:P(A∩B) = P(A)*P(B|A)=P(B)*P(A|B)。如上公式也可变形为:P(B|A) = P(A|B)*P(B) / P(A)。贝叶斯的统计学中有一个基本的工具叫贝叶斯公式、也称为贝叶斯法则, 尽管它是一个数学公式,但其原理毋需数字也可明了。如果你看到一个人总是做一些好事,...转载 2019-05-22 23:58:17 · 777 阅读 · 0 评论