CNN前提应该知道的专业术语

最新推荐文章于 2021-12-14 12:32:01 发布

qq_38300506

最新推荐文章于 2021-12-14 12:32:01 发布

阅读量719

点赞数

分类专栏：文档文章标签： CNN 专业术语

文档专栏收录该内容

2 篇文章 0 订阅

订阅专栏

作为一个刚进入人工智能的小白来说，查了很多东西，才知道CNN这家伙干了啥。

理解前提：

1.卷积

1）局部链接

对待像图像这样的高维数据，直接让神经元与前一层的所有神经元进行全连接是不现实的，这样做的害处显而易见: 参数过多，根本无法计算.
所以我们让每个神经元只与输入数据的一个局部区域连接，这个局部区域的大小就是局部感受野(receptive field)，尺寸上等同于filter的空间尺寸(比如5*5*3).

2）参数共享

2.图像采样

缩小图像（或称为下采样（subsampled）或降采样（downsampled））的主要目的有两个：1、使得图像符合显示区域的大小；2、生成对应图像的缩略图。

放大图像（或称为上采样（upsampling）或图像插值（interpolating））的主要目的是放大原图像,从而可以显示在更高分辨率的显示设备上。对图像的缩放操作并不能带来更多关于该图像的信息, 因此图像的质量将不可避免地受到影响。然而，确实有一些缩放方法能够增加图像的信息，从而使得缩放后的图像质量超过原图质量的。

下采样原理：对于一幅图像I尺寸为M*N，对其进行s倍下采样，即得到(M/s)*(N/s)尺寸的得分辨率图像，当然s应该是M和N的公约数才行，如果考虑的是矩阵形式的图像，就是把原始图像s*s窗口内的图像变成一个像素，这个像素点的值就是窗口内所有像素的均值。

上采样原理：图像放大几乎都是采用内插值方法，即在原有图像像素的基础上在像素点之间采用合适的插值算法插入新的元素。

常用的插值方法

1、最邻近元法

2、双线性内插法

3、三次内插法

三次曲线插值方法计算量较大，但插值后的图像效果最好。

3.激活函数

作用：

1.引入非线性因素。

在我们面对线性可分的数据集的时候，简单的用线性分类器即可解决分类问题。但是现实生活中的数据往往不是线性可分的，面对这样的数据，一般有两个方法：引入非线性函数、线性变换。

2.线性变换

就是把当前特征空间通过一定的线性映射转换到另一个空间，让数据能够更好的被分类。

4.池化

Pooling 的本质，其实是采样，常规选择一组特征图形中的像素的最大值作为一个值。

5.感受野

局部感知野就是指卷积层的神经元只和上一层的feature

感受野：在卷积神经网络CNN中，决定某一层输出结果中一个元素所对应的输入层的区域大小，被称作感受野receptive field。

我们看这段定义非常简单，用数学的语言就是感受野是CNN中的某一层输出结果的一个元素对应输入层的一个映射。再通俗点的解释是，feature map上的一个点对应输入图上的区域。注意这里是输入图，不是原始图。好多博客写的都是原图上的区域，经过一番的资料查找，发现并不是原图。

另外加上一句，目前流行的物体识别方法都是围绕感受野来做的设计，就如上文提到的SSD和Faster RCNN。理解好感受野的本质我觉的有两个好处。一，理解卷积的本质；二，更好的理解CNN的整个架构。

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
CNN前提应该知道的专业术语

作为一个刚进入人工智能的小白来说，查了很多东西，才知道CNN这家伙干了啥。理解前提：1.卷积1）局部链接对待像图像这样的高维数据，直接让神经元与前一层的所有神经元进行全连接是不现实的，这样做的害处显而易见: 参数过多，根本无法计算. 所以我们让每个神经元只与输入数据的一个局部区域连接，这个局部区域的大小就是局部感受野(receptive field)，尺寸上等同于filter的空间尺寸(比如5*5...
复制链接

扫一扫

专栏目录

qq_38300506 CSDN认证博客专家 CSDN认证企业博客

码龄7年

5: 原创

61万+: 周排名

11万+: 总排名

7338: 访问

: 等级

181: 积分

60: 粉丝

86: 获赞

5: 评论

101: 收藏

私信

关注

热门文章

分类专栏

代码 1篇
文档 2篇
softmax理解 1篇
g' 1篇

最新评论

X-AnyLabeling转换为CVAT COCO1.0 格式
CSDN-Ada助手: Python入门技能树或许可以帮到你：https://edu.csdn.net/skill/python?utm_source=AI_act_python
PCL8叉树应用
CSDN-Ada助手: 恭喜用户撰写了第6篇博客，题为“PCL8叉树应用”。我很高兴看到您对PCL8叉树应用进行了深入研究，并分享了您的见解。持续创作是非常难得的品质，您的坚持和努力令人钦佩。在下一步的创作中，或许您可以考虑探索更多PCL8叉树应用的实例，或者分享一些实践经验，以帮助读者更好地理解和应用这一技术。此外，您也可以考虑与读者互动，接受他们的反馈和建议，以进一步改善您的文章。我期待着您未来的创作，并相信您会在这个领域取得更大的成就。谢谢您的分享！
Vitis-ai(V3.0) YOLOV3的量化
CSDN-Ada助手: 恭喜您在博客中分享了关于Vitis-ai(V3.0) YOLOV3的量化的内容，这对于我们理解和掌握这一技术非常有帮助。希望您能够继续保持创作的热情，分享更多关于Vitis-ai和其他领域的相关内容。或许下一步您可以考虑探讨一下Vitis-ai(V3.0) YOLOV3的优化方法，这也许可以为我们提供更多的启发。期待您的下一篇博客！如何快速涨粉，请看该博主的分享：https://hope-wisdom.blog.csdn.net/article/details/130544967?utm_source=csdn_ai_ada_blog_reply5
Lift Splat Shoot代码梳理
CSDN-Ada助手: 恭喜作者在博客中对“Lift Splat Shoot”代码进行了梳理，这对于理解和学习该代码一定有很大的帮助。希望作者能够继续保持创作的热情和动力，为我们带来更多有价值的内容。下一步，或许可以考虑加入一些个人见解和实践经验，让读者更好地理解和运用这些代码。期待作者的下一篇作品！
AprilTag3求取位姿
CSDN-Ada助手: 恭喜你写了第四篇博客！看来你对AprilTag3求取位姿有了深入的研究。我觉得你可以考虑在下一篇博客中分享一些实际应用案例，或者对比不同方法的优缺点，这样可以让读者更加深入地了解这个主题。希望你能继续保持创作的热情，期待你的下一篇作品！如何快速涨粉，请看该博主的分享：https://hope-wisdom.blog.csdn.net/article/details/130544967?utm_source=csdn_ai_ada_blog_reply5

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。