模型分类与常用算法介绍

深耕智能驾驶

已于 2023-09-04 20:05:14 修改

阅读量2.8k

点赞数 15

分类专栏：监督学习系列文章标签：算法分类人工智能

于 2022-12-13 13:55:44 首次发布

本文链接：https://blog.csdn.net/jane0819/article/details/128300498

版权

监督学习系列专栏收录该内容

9 篇文章 0 订阅

订阅专栏

模型分类与常用算法介绍

1. 模型分类
2. 算法
- 2.1. 数学建模常用的十大算法
- 2.2. 算法与模型的关系

参考博文：
https://zhuanlan.zhihu.com/p/141479758
https://zhuanlan.zhihu.com/p/350307389
https://zhuanlan.zhihu.com/p/37821985

1. 模型分类

1.1. 判别模型VS生成模型

1.1.1. 判别模型

        由数据直接学习决策函数或者条件概率分布作为预测的模型，即判别模型。基本思想是有限样本条件下建立判别函数，不考虑样本的产生模型，直接研究预测模型。
    判别模型分为两种：
    (1)直接对输入空间到输出空间的映射进行建模，也就是学习函数 h
在这里插入图片描述
    (2)对条件概率P(y|x)进行建模，然后根据贝叶斯风险最小化的准则进行分类：

如感知机、逻辑斯特回归、支持向量机、神经网络、k近邻都属于判别学习模型。

1.1.2. 生成模型

由数据学习联合概率密度分布P(X,Y)，然后求出条件概率分布P(Y|X)作为预测的模型，即生成模型：
在这里插入图片描述
基本思想是首先建立样本的联合概率概率密度模型P(X,Y)，然后再得到后验概率P(Y|X)，再利用它进行分类，就像上面说的那样。P(X)就是训练数据的概率分布。

生成算法尝试去找到底这个数据是怎么生成的（产生的），然后再对一个信号进行分类。基于你的生成假设，那么那个类别最有可能产生这个信号，这个信号就属于那个类别。判别模型不关心数据是怎么生成的，它只关心信号之间的差别，然后用差别来简单对给定的一个信号进行分类。

1.2. 概率模型VS非概率模型

1.2.1. 概率模型

常用的估计有极大似然估计(MLE)和极大后验概率估计(MAP)等。其中，极大后验概率估计涉及到分布参数的先验概率，这为我们注入先验知识提供了途径。逻辑斯特回归、高斯判别分析、朴素贝叶斯都属于概率模型。

1.2.2. 非概率模型

非概率模型指的是直接学习输入空间到输出空间的映射h，学习的过程中基本不涉及概率密度的估计，概率密度的积分等操作，问题的关键在于最优化问题的求解。通常，为了学习假设h(x)，我们会先根据一些先验知识(prior knowledge) 来选择一个特定的假设空间H(函数空间)，例如一个由所有线性函数构成的空间，然后在这个空间中找出泛化误差最小的假设出来：

在这里插入图片描述

其中l(h(x),y)是我们选取的损失函数，选择不同的损失函数，得到假设的泛化误差就会不一样。由于我们并不知道P(x,y)，所以即使我们选好了损失函数，也无法计算出假设的泛化误差，更别提找到那个给出最小泛化误差的假设。于是，我们转而去找那个使得经验误差最小的假设：
在这里插入图片描述

这种学习的策略叫经验误差最小化(ERM)，理论依据是大数定律：当训练样例无穷多的时候，假设的经验误差会依概率收敛到假设的泛化误差。要想成功地学习一个问题，必须在学习的过程中注入先验知识。前面，我们根据先验知识来选择假设空间，其实，在选定了假设空间后，先验知识还可以继续发挥作用，这一点体现在为我们的优化问题(IV)加上正则化项上，例如常用的L1正则化，L2正则化等。

在这里插入图片描述
感知机、支持向量机、神经网络、k近邻都属于非概率模型。

1.3. 参数模型 VS 非参数模型

在统计学中，参数模型通常假设总体服从某个分布，这个分布可以由一些参数确定，如正态分布由均值和标准差确定，在此基础上构建的模型称为参数模型；非参数模型对于总体的分布不做任何假设或者说是数据分布假设自由，只知道其分布是存在的，所以就无法得到其分布的相关参数，只能通过非参数统计的方法进行推断。

所以说，参数模型和非参数模型中的“参数”并不是模型中的参数，而是数据分布的参数。需要注意，有参数模型它的参数是有限的，可以指定出θ1,θ2,…,θn，而非参数模型也并不是没有参数，而是参数的数目很多。

1.3.1. 参数模型

参数机器学习模型由于指定了目标函数的形式，所以可以极大地简化这个学习的过程，但是同样会限制学习的过程。所以参数机器学习模型包括两个部分：

     选择合适的目标函数的形式。
     通过训练数据学习目标函数的参数。

        举个线性回归的例子，线性回归作为常见的参数模型，它通过假设输入变量与输出变量之间具有线性关系，然后就可以设置目标函数为 Y = aX + bY，需要做的就是通过合适的方法如最小二乘法来拟合目标函数的参数。