图像分类与基础视觉(OpenMMLab第二课)

一、图像分类与基础视觉

  1. 图像分类:给定一张图片,识别图像中的物体是什么。

  1. 问题的数学表示:𝑋 ∈ ℝ𝐻×𝑊×3 对类别进行编号:香蕉→1,苹果→2,橘子→3 等等,得到类别 𝑦 ∈ {1, … ,𝐾},𝐾 为类别总数

图像分类问题:构建一个可计算实现的函数 𝐹: ℝ𝐻×𝑊×3 → {1, … ,𝐾},且预测结果符合人类认知

3.视觉任务的难点:图像的内容是像素整体呈现出的结果,和个别像素的值没有直接关联,难以遵循具体的规则设计算法

4. 让计算机从数据中学习:收集数据、定义模型(通常为含参变量的函数)、训练(寻找最佳参数,使得模型在训练集上达到最高正确率)、预测(对于新图像,用训练好的模型预测其类别)。

二、卷积神经网络

1.残差建模:让新增加的层拟合浅层网络与深层网络之间的差异,更容易学习 梯度可以直接回传到浅层网络监督浅层网络的学习 没有引入额外参入,让参数更有效贡献到最终的模型中 。

三、轻量化卷积神经网络

1.卷积的参数量

  1. 乘积的计算量(乘加次数)

  1. 降低模型参数量和计算量的方法

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值