图像分类与基础视觉（OpenMMLab第二课）

星光i9

于 2023-02-03 23:36:44 发布

阅读量71

点赞数

文章标签：计算机视觉 Powered by 金山文档

原文链接：https://space.bilibili.com/1293512903/channel/collectiondetail?sid=1068652

版权

一、图像分类与基础视觉

图像分类：给定一张图片，识别图像中的物体是什么。

问题的数学表示：𝑋 ∈ ℝ𝐻×𝑊×3 对类别进行编号：香蕉→1，苹果→2，橘子→3 等等，得到类别 𝑦 ∈ {1, … ,𝐾}，𝐾 为类别总数

图像分类问题：构建一个可计算实现的函数 𝐹: ℝ𝐻×𝑊×3 → {1, … ,𝐾}，且预测结果符合人类认知

3.视觉任务的难点:图像的内容是像素整体呈现出的结果，和个别像素的值没有直接关联，难以遵循具体的规则设计算法

4. 让计算机从数据中学习：收集数据、定义模型（通常为含参变量的函数）、训练（寻找最佳参数，使得模型在训练集上达到最高正确率）、预测（对于新图像，用训练好的模型预测其类别）。

二、卷积神经网络

1.残差建模：让新增加的层拟合浅层网络与深层网络之间的差异，更容易学习梯度可以直接回传到浅层网络监督浅层网络的学习没有引入额外参入，让参数更有效贡献到最终的模型中。

三、轻量化卷积神经网络

1.卷积的参数量

乘积的计算量（乘加次数）

降低模型参数量和计算量的方法

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
图像分类与基础视觉（OpenMMLab第二课）

图像分类与基础视觉
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。