计算机视觉在农业中的应用综述,深度学习与计算机视觉任务应用综述

最新推荐文章于 2024-05-02 00:32:46 发布

Sparkmlib

最新推荐文章于 2024-05-02 00:32:46 发布

阅读量552

点赞数

文章标签：计算机视觉在农业中的应用综述

Mask- RCNN进行目标检测(Object detection)和实例分割(instance segmentation)

想做计算机视觉吗？深度学习是当今技术发展的方向。大规模数据集加上深度卷积神经网络( CNNs )强大的表达能力，形成了超精确和鲁棒的模型。只有一个挑战仍然存在：如何设计你的模型。

对于像计算机视觉这样广泛和复杂的领域，解决方案并不总是清晰的。计算机视觉中的许多标准任务都需要特别考虑：分类(classification)、检测(detection)、分割(segmentation)、姿态估计(pose estimation)、增强和恢复(enhancement and restoration)以及动作识别(action recognition)。尽管用于每一个最先进的网络具有了共同的模式(结构)，但是它们都需要自己独特的结构设计。

那么，我们如何为所有这些不同的任务建立模型呢？让我向你展示如何用深度学习来完成计算机视觉中的所有事情！

分类(classification)

其中最著名的！图像分类网络从固定大小的输入开始。输入图像可以有任意数量的通道(channels)，但是对于RGB图像通常是3个。当你设计你的网络时，分辨率在技术上可以是任何大小，只要它足够大，可以支持你在整个网络中进行的下采样(downsampling)。例如，如果你在网络中进行4次下采样，那么你的输入至少需要4 = 16×16像素大小。

随着你的网络变得更深，空间分辨率将会降低，因为我们试图压缩所有的信息，并得到一维向量表示。为了确保网络始终有能力传送它提取的所有信息，我们根据深度成比例地增加特征图(feature map)的数量，以适应空间分辨率的降低。也就是说，我们在下采样过程中丢失了空间信息，为了弥补这一损失，我们扩展了特征图以增加语义信息。

在你选择了一定量的下采样后，特征图将被矢量化并馈送到一个全连接网络中。最后一层的输出与数据集中的类别数量一样多。

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。