PAC学习理论

我不是程序员‍

于 2023-08-12 10:44:50 发布

阅读量354

点赞数

分类专栏：机器学习文章标签：机器学习人工智能

本文链接：https://blog.csdn.net/m0_48241022/article/details/132245491

版权

机器学习专栏收录该内容

34 篇文章

订阅专栏

当使用机器学习方法来解决某个特定问题时，通常靠经验或者多次试验来选择合适的模型、训练样本数量以及学习算法收敛的速度等．但是经验判断或多次试验往往成本比较高，也不太可靠，因此希望有一套理论能够分析问题难度、计算模型能力，为学习算法提供理论保证，并指导机器学习模型和学习算法的设计．这就是计算学习理论．计算学习理论（ Computational Learning Theory）是机器学习的理论基础，其中最基础的理论就是可能近似正确（ Probably Approximately Correct， PAC ）学习理论．

机器学习中一个很关键的问题是期望错误和经验错误之间的差异，称为泛化错误（ Generalization Error ）．泛化错误在有些文献中也指期望错误，指在未知样本上的错误．泛化错误可以衡量一个机器学习模型𝑓 是否可以很好地泛化到未知数据．

由于我们不知道真实的数据分布 𝑝(𝒙, 𝑦)，也不知道真实的目标函数 𝑔(𝒙)，因此期望从有限的训练样本上学习到一个期望错误为0的函数𝑓(𝒙)是不切实际的．因此，需要降低对学习算法能力的期望，只要求学习算法可以以一定的概率学习到一个近似正确的假设，即 PAC 学习（ PAC Learning ）．一个 PAC 可学习（PAC-Learnable ）的算法是指该学习算法能够在多项式时间内从合理数量的训练数据中学习到一个近似正确的𝑓(𝒙) ．