DATE: 2016.9.22
文章目录
机器学习10大经典算法简介:
1、C4.5
C4.5算法是机器学习算法中的一种分类决策树算法,其核心算法是ID3算法. C4.5算法继承了ID3算法的优点,并在以下几方面对ID3算法进行了改进:
1)用信息增益率来选择属性,克服了用信息增益选择属性时偏向选择取值多的属性的不足;
2)在树构造过程中进行剪枝;
3)能够完成对连续属性的离散化处理;
4)能够对不完整数据进行处理。
C4.5算法有如下优点:产生的分类规则易于理解,准确率较高。其缺点是:在构造树的过程中,需要对数据集进行多次的顺序扫描和排序,因而导致算法的低效。
2、The k-means algorithm即K-Means算法
k-means algorithm算法是一个聚类算法,把n的对象根据他们的属性分为k个分割,k < n。它与处理混合正态分布的最大期望算法很相似,因为他们都试图找到数据中自然聚类的中心。它假设对象属性来自于空间向量,并且目标是使各个群组内部的均方误差总和最小。
3、Support vector machines支持向量机
支持向量机(Support Vector Machine),简称SV机(论文中一般简称SVM)。它是一种监督式学习的方法,它广泛的应用于统计分类以及回归分析中。支持向量机将向量映射到一个更高维的空间里,在这个空间里建立有一个最大间隔超平面。在分开数
本文介绍了机器学习的十大经典算法,包括C4.5决策树、K-Means聚类、支持向量机(SVM)、Apriori关联规则、最大期望(EM)算法、PageRank网页排名、AdaBoost迭代算法、kNN最近邻分类、朴素贝叶斯分类以及CART回归树。这些算法在分类、聚类和预测等领域有着广泛应用。
订阅专栏 解锁全文
10万+

被折叠的 条评论
为什么被折叠?



