1.集成学习
通过训练若干个个体学习器,通过一定的结合策略,来完成学习任务。
2.支持向量机
尝试拟合两个类别之间最宽的间距
3。软间隔
软间隔是一种支持向量机中的概念,允许一定程度的分类错误,以便在处理线性不可分数据时达到更好的分类效果。
4.核函数
让原本在低维空间中线性不可分的数据变得在高维空间中线性可分。常见的有
线性核函数 K ( x , y ) = x T y K(x, y) = x^Ty K(x,y)=xTy
多项式核函数 K ( x , y ) = ( x T y + c ) d K(x, y) = (x^Ty + c)^d K(x,y)=(xTy+c)d
高斯径向基函数核 K ( x , y ) = exp ( − ∣ ∣ x − y ∣ ∣ 2 2 σ 2 ) K(x, y) = \exp(-\frac{||x - y||^2}{2\sigma^2}) K(x,y)=exp(−2σ2∣∣x−y∣∣2)
5.VC维
度量机器学习算法的学习能力和泛化性能
6.生成模型
通过对观察数据的概率分布,生成与训练数据具有相似特征的新数据
7.判别模型
找到一个边界或者函数,以便根据输入数据准确地预测输出标签
8.生成式模型和判别式模型优缺点
生成式模型优点
- 可以学习数据的概率分布
- 对数据的结构和关系有更深入的理解
判别式模型优点
- 预测性能较好
- 计算效率较高
一个的优点就是另一个的缺点
9.监督学习是判别式方法,无监督学习是生成式方法
不正确,监督学习和无监督学习描述的是学习任务的类型,生成式方法和判别式方法描述的是模型的学习方式。
10.分类是判别式方法,聚类是生成式方法?KNN,K-means分别是什么方法?
不正确,KNN判别式,kmeans生成式。