卷积核和学习和训练

lock cylinder

于 2023-12-29 15:40:37 发布

阅读量534

点赞数 9

文章标签：深度学习计算机视觉人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_34144750/article/details/135292465

版权

如果我们已知原始的图像数据，和这个图像经过某个卷积核计算后，得到的新的数据，那么如何计算出这个卷积核中的具体参数呢？

例如，已知输入图像是12*12的，经过某个3*3的卷积核，得到的输出数据是10*10的。

那么如何求出，这个卷积核中的9个参数呢？

可能有的同学知道，中间的这个卷积核，其实是一个拉普拉斯算子，也就是中间是8，周围是-1的，3乘3数组。

我们接下来要做的是，使用pytorch框架，通过梯度下降算法，基于输入和输出数据，训练出这个拉普拉斯卷积核。

1.训练数据的准备

在main函数中，声明img数组，保存输入图像。

因为我们需要生成输出数据，所以要提前设置一个拉普拉斯卷积核kernel，用作输出数据Y的生成。

然后调用函数functional.conv2d，计算img和kernel的卷积运算，得到输出图像，保存在Y中。

特别要注意的是，在后面训练过程中，我们只会使用img和Y，并不会使用kernel。

此处的kernel，只是用来计算输出图像Y的，而后面要根据img和Y，重新训练出kernel中的参数。

2.训练卷积核中的参数

接着，构造一个卷积核weight。

这里要注意，卷积核是四维张量，前两个维度代表了卷积核的数量和输入通道数量，这里都是1。

后面的两个3，代表了卷积核的大小，是3乘3的。

定义学习速率lr和迭代次数num。

我们需要注意的是，如果学习速率lr过大，梯度下降的过程中就会出现溢出错误。

如果迭代次数不足，则无法收敛到最优解。

这里定义的学习速率是10的-7次方，迭代次数是10000，这些值都是经过实验得出的合适值。

然后进入卷积核的迭代循环。

在循环中，首先计算基于当前参数的预测值predict。

根据平方误差，计算预测值和真实值之间的损失值loss。

这里就是要训练出一组参数，使loss取得最小值。

换句话说，就是要找到使predict和Y相等的参数。

接着使用backward函数进行反向传播，计算出损失loss关于参数weight的梯度。

梯度会保存在weight.grad中。这里我们直接使用梯度下降算法，更新weight保存的数据。

最后调用zero_grad清空上一轮迭代的梯度。

为了便于调试，我们每迭代1000轮，就打印一次loss的值进行观察。

最后打印训练好的卷积核中的参数。

运行程序，我们会发现，经过10000轮的迭代，损失值loss会变得非常小。

最终就得到一个3乘3的卷积核：

而该卷积核中保存的数据，就非常接近原来设置的卷积核了。

关注

9
点赞
踩
9

收藏

觉得还不错? 一键收藏
0
评论
卷积核和学习和训练

如果我们已知原始的图像数据，和这个图像经过某个卷积核计算后，得到的新的数据，那么如何计算出这个卷积核中的具体参数呢？例如，已知输入图像是12*12的，经过某个3*3的卷积核，得到的输出数据是10*10的。那么如何求出，这个卷积核中的9个参数呢？可能有的同学知道，中间的这个卷积核，其实是一个，也就是中间是8，周围是-1的，3乘3数组。我们接下来要做的是，使用pytorch框架，通过梯度下降算法，基于输入和输出数据，训练出这个。
复制链接

扫一扫

lock cylinder CSDN认证博客专家 CSDN认证企业博客

码龄8年

53: 原创

19万+: 周排名

3万+: 总排名

4万+: 访问

: 等级

880: 积分

185: 粉丝

260: 获赞

7: 评论

356: 收藏

私信

关注

热门文章

分类专栏

技术 3篇

最新评论

PyTorch构建自然语言处理模型
CSDN-Ada助手: 不知道 Python入门技能树是否可以帮到你：https://edu.csdn.net/skill/python?utm_source=AI_act_python
three.js中GlTF模型渲染优化
小猪BUG: 有没有work.js中的代码，大佬
three.js中GlTF模型渲染优化
CSDN-Ada助手: 恭喜你这篇博客进入【CSDN每天值得看】榜单，全部的排名请看 https://bbs.csdn.net/topics/617614328。
three-fbx模型开发如何处理透明贴图问题
lock cylinder: child.material.transparent = true; child.material.alphaTest = 0.1; child.material.map.wrapS = THREE.RepeatWrapping; child.material.map.wrapT = THREE.RepeatWrapping; child.material.repeat.set(10, 10); 上面是设置模型材质的代码，但是最关键的是child.material.alphaTest = 0.1，这个值0.1可以自行调整
three-fbx模型开发如何处理透明贴图问题
lock cylinder: child.material.transparent = true; child.material.alphaTest = 0.1; child.material.map.wrapS = THREE.RepeatWrapping; child.material.map.wrapT = THREE.RepeatWrapping; child.material.repeat.set(10, 10); 上面是设置模型材质的代码，但是最关键的是child.material.alphaTest = 0.1，这个值0.1可以自行调整

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。