线性与非线性的理解

最新推荐文章于 2022-11-09 10:44:34 发布

小猪崽子～

最新推荐文章于 2022-11-09 10:44:34 发布

阅读量3.1k

点赞数

分类专栏：学习文章标签：问题的线性非线性理解

本文链接：https://blog.csdn.net/weixin_41938903/article/details/102577257

版权

学习专栏收录该内容

5 篇文章 0 订阅

订阅专栏

1.问题的线性非线性

理解的区别：现有的样本点能否在输入空间上，用线性超平面区分；

2.模型的线性非线性

基础数学说，线性指变量之间的数值关系，即满足成比例。因此，变量之间的多项式、指数等关系都算是非线性。

网上有一批文章认为，ML 模型的线性非线性，指模型参数之间的关系，即决策函数 y=w_1x_1^2 + w_2x_2^2 是线性模型，而 y=w_1^2x_1 + w_2^2x_2 是非线性模型。
我认为这是不对的。

ML 模型的的线性非线性，应该指特征变量之间的关系，即决策函数 y=w_1x_1^2 + w_2x_2^2 是非线性模型，而 y=w_1^2x_1 + w_2^2x_2 是线性模型。

实际上，并不会出现后一种决策函数，貌似没有哪种模型学到的决策函数会在参数上进行非线性变换，那么这种变换并不会在 loss function 的优化过程中起到作用，最终对学习到的 model 并不会产生影响，因此，后一种模型和 y=w_1x_1 + w_2x_2 并无二致。

2.1 谈谈 LR、SVM 和 MLP 中的非线性

（1）LR，准确来说应该是广义线性模型。其决策面仍是线性的 y=w_1x_1 + w_2x_2，只不过在输出时，套用 sigmoid 函数，得到了分类的置信度。如果从最后的决策函数 f(x) = 1 / (1+exp(w_1x_1 + w_2x_2)) 来看，确实特征变量 x_1 和 x_2 之间由于 sigmoid 函数作用，呈现了非线性关系，但这种非线性并不是直接作用在输入特征空间的，而是对输出空间进行的非线性映射。

（2）SVM，有线性和非线性版本。线性SVM，其模型本身就是在寻求一个超平面，只是策略是找到间隔最大的那个超平面。而非线性SVM，虽说在特征空间上仍是分类超平面，但是先采用了核技巧从输入空间向特征空间进行了非线性映射。

（3）MLP，其嵌套函数的特点就反映了，它的非线性更像 LR ，即从每层来看，输入并没有进行 SVM 那样的非线性特征变换，但在输出时进行了非线性映射，那么多层重叠，也就实现了特征的非线性交叉。

通过上面分析，就能看出，ML 模型的非线性，指的是特征之间的非线性关系。