机器学习知识要点汇总
1. 机器学习的常见分类和常用的算法有哪些?
将机器学习分为四种,分别是监督学习、无监督学习、半监督学习和增强学习。
(1)监督学习(Supervised Learning):是指每个进入算法的训练数据样本都有对应的期望值也就是目标值,进行机器学习的过程实际上就是特征值和目标队列映射的过程;通过过往的一些数据的特征以及最终结果来进行训练的方式就是监督学习法;监督学习算法的训练数据源需要由特征值以及目标队列两部分组成。
因为监督学习依赖于每个样本的打标,可以得到每个特征序列映射到的确切的目标值是什么,所以常用于回归以及分类场景。常见的监督学习算法如下表所示:
算法 |
具体包括 |
分类算法
|
K近邻(k-Nearest Neighbor,KNN)、朴素贝叶斯(Naive Bayesian algorithm)、决策树(Decision Tree)、随机森林(Random forest)、GBDT(GradientBoostingDecisionTree, 梯度提升迭代决策树)和支持向量机(Support Vector Machine, SVM)等 |
回归算法
|
逻辑回归(Logistic Regressive)、线性回归(Linear Regression)等
|
监督学习的一个问题就是获得目标值的成本比较高。
(2)无监督学习(Unsupervised Learning):就是指训练样本不依赖于打标数据的机器学习算法,它主要是用来解决一些聚类场景的问题。常见的无监督学习算法如下表所示:
算法 |
具体包括 |
聚类算法
|
K-Means(k-means clustering algorithm,k均值聚类算法)、DBSCAN(聚类算法,Density-Based Spatial Clustering of Applications wit)等
|
推荐算法
|
协同过滤(Collaborative Filtering)等
|
相较于监督学习,无监督学习的一大好处就是不依赖于打标数据。</