机器学习训练模型是什么训练是什么模型是什么

最新推荐文章于 2024-08-16 10:48:16 发布

一做就废

最新推荐文章于 2024-08-16 10:48:16 发布

阅读量6k

点赞数 6

分类专栏：机器学习

原文链接：https://www.zhihu.com/question/29271217/answer/45665100

版权

机器学习专栏收录该内容

3 篇文章 0 订阅

订阅专栏

先从有监督问题谈起，形式上，无论解析还是非解析，有监督问题都可看作根据已知数据在全体映射空间F中寻找最优映射f*(x)=y,其中x为输入，y为输出。寻找符合已知数据的映射很简单，难点在于理论上来说，未知输入等可能对应任意输出，这样一来预测则成为无稽之谈(No Free Lunch)。

举个例子，求解找规律题目“1, 2, 3, 4, ( ), 6”，一般人都会在括号里填5。
然而理论上来说这个括号里可以是任意数字，比如4。
不知道大家是否考虑过凭什么“每次增1”是规律，而“先增三次1然后保持不变然后再持续增1”就不可以是规律。
那是因为我们不知不觉中使用了题目并未给出的一些前提假设，
比如奥卡姆剃刀原则，“每次增1”看起来明显比后者更简洁优雅，更容易被人接受。

解释这个概念就不能不提到Inductive Bias，意指在求解学习问题前必须拥有的一系列前提假设。当我们选定一个广义上的model，其实可以看作选定了一组inductive bias。特定的model/inductive bias可以在浩瀚的全体映射空间 $F$ 中圈定出一个子空间 $\^{F}$ ，然后通过inductive bias提供的方式(一般为某种loss function)寻找符合已知数据的model参数，从而又在 $\^F$ 中进一步缩小搜索范围直至确定最优或次优映射 $\^f$ (f*可能根本不在 $\^F$ 中)。

所以应了那句话，“All models are wrong, but some are useful.” 得出什么样的答案，很大程度上取决于我们使用什么样的假设。

那么此问题的答案是：模型是求解学习问题的一系列前提假设/inductive bias，根据已知数据寻找模型参数的过程就是训练，最终搜索到的映射 $\^f$ 被称为训练出来的模型。

注：

1. 这里所谓的“最优”，“次优”，“符合”等描述是根据预先设定好的测量标准/目标函数进行
阐释的，属于model/inductive bias的一部分。

2. 之所以说“广义上的model”，是因为一般形式上会对prior distribution，model(实际指映射
表达式)以及loss function等进行区分，这里为方便阐述，不加区分的算成广义上
的model，因其均为inductive bias。

无监督问题大致上也类似，前提假设甚至会表现得更为明显，有一则段子：

@南大周志华