关于离散图像与深度学习模型可微的一些思考

shelly_fun

已于 2023-09-19 19:28:36 修改

阅读量148

点赞数

文章标签：深度学习人工智能

于 2023-09-19 17:43:32 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_38385468/article/details/133037980

版权

本文探讨了数字图像处理中的离散像素概念，将图像视为一维实数域上的连续采样。深度学习模型强调可微性，意味着网络结构中的线性/非线性函数需具备可导性。文章解释了可微性的必要性，并提及神经网络权重调整基于输出的小变化来优化网络行为。

摘要由CSDN通过智能技术生成

在数字图像处理中，图像是由一个个离散像素点组成的矩阵，该矩阵是离散的。

我们说，图像是一个连续分布的采样，比较贴切的理解来说，就类似在一个一维实数域R上取了一个数，只不过此时所取的数来自R^{MxN}。

我们说，深度学习模型需要可微，那么这个可微是指什么？就好像大家下意识会想到Loss需要可微不然无法反传一样，Loss只是整个神经网络的一环，是其中的一个可微的函数，包括经典MLP中的仿射变换以及CNN中的卷积操作，事实上都只是一个线性/非线性可微/连续函数，整个网络是一个线性/非线性映射f(·)，网络的可微应该指的是抛开输入(我们取到的离散图像)后由所有神经元以及Loss所组成的函数f是可微的。那么此时，图像作为数据输入，从属于该函数的定义域，就如同向一元二次函数中输入一个x=1一样。

神经网络要求可微或存在次微分，该需求即可有如下的性质：

If it were true that a small change in a weight (or bias) causes only a small change in output, then we could use this fact to modify the weights and biases to get our network to behave more in the manner we want.

个人学习理解，不一定正确，如有错误敬请提出。

ref：

Neural networks and deep learning

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
关于离散图像与深度学习模型可微的一些思考

就好像大家下意识会想到Loss需要可微不然无法反传一样，Loss只是整个神经网络的一环，是其中的一个可微的函数，包括经典MLP中的仿射变换以及CNN中的卷积操作，事实上都只是一个线性/非线性可微/连续函数，整个网络是一个线性/非线性映射f(·)，网络的可微应该指的是抛开输入(我们取到的离散图像)后由所有神经元以及Loss所组成的函数f是可微的。我们说，图像是一个连续分布的采样，比较贴切的理解来说，就类似在一个一维实数域R上取了一个数，只不过此时所取的数来自R^{MxN}。
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。