深度学习多通道信息融合_学习深度学习中的视觉信息表示(一)图像特征提取和视觉信息表示的区别...

本文探讨了深度学习在计算机视觉领域的应用,特别是视觉信息表示从传统方法到深度学习的转变。文章阐述了图像特征提取与视觉信息表示的区别,并以AlexNet为例说明深度学习如何通过自动学习的视觉信息表示提高物体识别的准确性。深度学习模型如卷积神经网络(CNN)在多个视觉任务中展现出强大的性能,推动了视觉信息表示的革新。
摘要由CSDN通过智能技术生成

5469827151a4ed2648a2a64388b3ad0e.png

深度学习中的视觉表示 本文主要介绍关于计算机视觉领域的深度学习和视觉信息表示。首先介绍视觉信息是什么,在产业界的很多应用中,通常需要从图像或者视频的输入出发,解决诸如人脸检测/识别,姿态/行为识别,或者物体检测/识别,自动驾驶/控制,场景几何特征分析等问题。这些问题有一个共同点,就是需要在某种程度上理解图像内容,不仅只是存储传输,或者显示图像。那么就需要把图像或者视频转化为更方便获取它的内容的某种表示形式,然后再从这种表示形式出发来解决某中具体应用的问题。 更具体的就是,图像或者视频在计算机中存储的形式是每个像素点的明暗程度或者颜色,

ac4c44e8bcd79fdcb5a5a139f786511d.png

上图是经典的lena图像(Lena的图片是《花花公子》拍摄的照片,几十年来一直是图像处理的测试标准),上图中红色方框标识区域的内容是帽子的一部分边界,用每个像素的明暗程度来表示就是左边的数字,那么这种原始的表示形式离图像的内容是非常遥远的,很难想象如何设计一个算法直接数字中理解帽子是什么,所以就需要先把它转化为更高级的,更贴近图像内容的识别表示

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值