计算机视觉的 基础学习

四大基本任务

  • 图像分类:给定一张输入图像,图像分类任务旨在判断该图像所属类别。

  • 目标定位:以包围框的(bounding box)形式得到图像类别位置,通常只有一类目标或固定数目的目标和背景类。

  • 目标检测:相对于目标定位,目标种类和数目不定。

  • 语义分割:语义分割需要判断图像中哪些像素属于哪个目标。

  • 实例分割:语义分割不区分属于相同类别的不同实例。例如,当图像中有多只猫时,语义分割会将两只猫整体的所有像素预测为“猫”这个类别。与此不同的是,实例分割需要区分出哪些像素属于第一只猫、哪些像素属于第二只猫。

在这里插入图片描述

难点

语义鸿沟,拍摄视角变化,目标占据图像的比例变化,光照变化,背景相似,目标形变,遮挡。

卷积层

标准卷积、深度方向的可分离卷积(SeparableConv2D)、深度可分离卷积(DepthwiseConv2D)、转置卷积(反卷积)、空洞卷积。

为什么用卷积

图像数据维度高,Dense参数多、计算量大、容易过拟合。

卷积:

  • 局部连接:
    图像特征、边缘、角点只占据图像很小的部分,相隔较远的

  • 1
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值