为什么神经网络无法用解析解来解？

最新推荐文章于 2022-07-11 23:16:18 发布

asasasaababab

最新推荐文章于 2022-07-11 23:16:18 发布

阅读量1.1k

点赞数 1

分类专栏：学习笔记文章标签：神经网络深度学习数学

本文链接：https://blog.csdn.net/asasasaababab/article/details/119249009

版权

这个是面试是遇到的这个问题。说对于线性回归，可以用normal equation来解，但是为何deep learning没法用解析解？当时答得略差。从网上找答案暂时也没有特别好的答案，因此我自己想了一下，总结在这里。对于类似于sigmoid、tanh还有什么softplus之类奇奇怪怪的激活函数来说，以及类似交叉熵之类的损失函数来说，前向推断直接求导之后等于0，求极值，这个方程是超越方程，没有解析解。事实上人类能解的方程很少的。即使是最简单的多项式方程来说，大于等于5次的，都没有解析解求解（ Abel

摘要由CSDN通过智能技术生成

这个是面试是遇到的这个问题。说对于线性回归，可以用normal equation来解，但是为何deep learning没法用解析解？当时答得略差。从网上找答案暂时也没有特别好的答案，因此我自己想了一下，总结在这里。

对于类似于sigmoid、tanh还有什么softplus之类奇奇怪怪的激活函数来说，以及类似交叉熵之类的损失函数来说，前向推断直接求导之后等于0，求极值，这个方程是超越方程，没有解析解。事实上人类能解的方程很少的。即使是最简单的多项式方程来说，大于等于5次的，都没有解析解求解（ Abel–Ruffini theorem），更别说类似什么sigmoid套sigmoid套sigmoid之类的这种方程了。
最简单一些的网络，比方说前向的，激活函数是relu。由于relu是分段线性函数，前向推断可以是分段线性函数。这个时候假如loss又是l2 loss啊，l1 loss啊这类简单的，确实可以求解析解。但是要考虑的是规模。比方说，一共2层神经元，每层2个，ok，那就是16段线性( $2^{2\times2}=16$

最低0.47元/天解锁文章

asasasaababab

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
为什么神经网络无法用解析解来解？

这个是面试是遇到的这个问题。说对于线性回归，可以用normal equation来解，但是为何deep learning没法用解析解？当时答得略差。从网上找答案暂时也没有特别好的答案，因此我自己想了一下，总结在这里。对于类似于sigmoid、tanh还有什么softplus之类奇奇怪怪的激活函数来说，以及类似交叉熵之类的损失函数来说，前向推断直接求导之后等于0，求极值，这个方程是超越方程，没有解析解。事实上人类能解的方程很少的。即使是最简单的多项式方程来说，大于等于5次的，都没有解析解求解（ Abel
复制链接

扫一扫

专栏目录