机器学习
机器学习学习中,一同分享
**猿来是你**
这个作者很懒,什么都没留下…
展开
-
机器学习算法-k-means聚类算法介绍
聚类算法介绍:在“无监督学习”(unsupervised learning)中,训练样本的标记信息是未知的,目标是通过对无标记训练样本的学习来揭示数据的内在性质及规律,为进一步的数据分析提供基础、此类学习任务中研究最多、应用最广的是“聚类”(clustering)。聚类试图将数据集中的样本划分为若千个通常是不相交的子集,每个子集称为一个“簇”(cluster). 通过这样的划分,每个簇可能对应于一些潜在的概念(类别),如“浅色瓜”“ 深色瓜”“有籽瓜”“无籽瓜”,甚至“本地瓜”“外地瓜”等。评价指标:原创 2020-05-23 22:50:50 · 1305 阅读 · 1 评论 -
机器学习算法-KNN算法
KNN 算法介绍:k-近邻算法(k-Nearest Neighbour algorithm),又称为KNN算法,是数据挖掘技术中原理最简单的算法。KNN的工作原理:给定一个已知标签类别的训练数据集,输入没有标签的新数据后,在训练数据集中找到与新数据最邻近的k个实例,如果这k个实例的多数属于某个类别,那么新数据就属于这个类别。可以简单理解为:由那些离X最近的k个点来投票决定X归为哪一类。图1中有红色三角和蓝色方块两种类别,我们现在需要判断绿色圆点属于哪种类别:当k=3时,绿色圆点属于红色三角这种类别;原创 2020-05-17 22:28:49 · 292 阅读 · 0 评论 -
机器学习算法-决策树分类算法
决策树介绍:决策树分类算法是一种基于实例的归纳学习方法,它能从给定的无序的训练样本中,提炼出树型的分类模型。树中的每个非叶子节点记录了使用哪个特征来进行类别的判断,每个叶子节点则代表了最后判断的类别。根节点到每个叶子节点均形成一条分类的路径规则。而对新的样本进行测试时,只需要从根节点开始,在每个分支节点进行测试,沿着相应的分支递归地进入子树再测试,一直到达叶子节点,该叶子节点所代表的类别即是当前测试样本的预测类别。一般的,一棵决策树包含一个根结点、若千个内部结点和若千个叶结点;叶结点对应于决策结果,其他原创 2020-05-17 20:33:20 · 2008 阅读 · 0 评论 -
机器学习算法-贝叶斯分类
贝叶斯分类算法介绍:贝叶斯分类算法是统计学的一种概率分类方法,朴素贝叶斯分类是贝叶斯分类中最简单的一种。 其分类原理就是利用贝叶斯公式根据某特征的先验概率计算出其后验概率,然后选择具有最大后验概率的类作为该特征所属的类。之所以称之为"朴素",是因为贝叶斯分类只做最原始、最简单的假设:所有的特征之间是统计独立的。假设某样本X有a1, a2.,…an个属性,那么有P(X)= P(a1,a2…,an)= P(a1)* P(a2)… P(an),满足样的公式就说明特征统计独立。条件概率公式条件概率(Condi原创 2020-05-14 10:54:10 · 1988 阅读 · 0 评论