CV (2)- image classification

本次学习笔记主要记录学习CV时的各种记录,包括李飞飞团队的视频cs231n。作者能力有限,如有错误等,望联系修改,非常感谢!

CV (2)- image classification


第一版       2022-07-19        初稿

数据驱动方法

在这里插入图片描述
图像分类时可能收到一张猫图,确认了分类或标签的集合。
在这里插入图片描述
图像给出像素红、绿、蓝三个值。
语义鸿沟。相机移动到不同位置拍摄,它仍是同一只猫。
照片可能在光照或黑暗中。猫可能是变形的。遮挡问题。图片北京混乱(猫色和背景色相似)。还有类内差异,一群不同种类的猫。
在这里插入图片描述
可能要写一些python代码,接受一个图片作为参数。
在这里插入图片描述
计算出图像的边缘。
在这里插入图片描述
数据驱动的方法:
1.抓取大量猫的数据集
2.使用机器学习训练分类器
3.评估新图的分类效果
在这里插入图片描述
常用的数据集 CIFAR-10。最近邻算法计算。
在这里插入图片描述
L1距离,有时称为曼哈顿距离。只取一部分像素相减,最后将所有相加。
在这里插入图片描述
train():训练函数,运用于最近邻算法。
predict():测试时,输入图像并使用L1距离函数。将测试图像和训练图像进行比较,在训练集中找到最相似的实例。

N个实例,训练和预测速度?
Train O(1);predict O(N)
我们想要训练缓慢,训练优秀的分类器,而预测迅速。
在这里插入图片描述
最近邻分类器:
此分类器并非最好的选择,图像中间集中大量绿点,但中间却有一个黄点。
于是就有了K-NN分类器。不仅是只寻找最近的点,会根据距离度量,找到最近的K个点。

K-NN

在这里插入图片描述
在这里插入图片描述
L1有坐标依赖,若向量中的各个元素有着实际意义,L1会更好。建议两种尝试下比较。
在这里插入图片描述
在这里插入图片描述
超参数:
1.K值
2.距离度量
(1)在数据集上工作最好的超参数,但这样不好,因为K=1对于我们表现得很好了;
(2)应让训练器在其他未知数据集上测试,应在其上面表现良好,但实际上这也不好。
(3)最好的方法是分为三组:训练集、验证集、测试集,选择在验证集上表现最佳的分类器,在测试集上跑。
在这里插入图片描述
交叉验证集:
在小数据集更常用。
在这里插入图片描述
交叉验证后会得到如图所示,x轴表示K值,y表示分类器对于数据集的准确度。
在这里插入图片描述
K-NN在图像分类很少使用,因为测试时太慢;距离度量标准用在比较图像上不太合适。
在这里插入图片描述
K-NN另一问题是维度灾难。像素点应密集的分布。

线性分类

在这里插入图片描述
输入图片,生成一句描述语句。卷积网络关注图像,循环神经网络关注语言。
在这里插入图片描述
在这里插入图片描述
f(x,W)=Wx+b
在这里插入图片描述
把2x2图像拉伸为一个向量。
在这里插入图片描述
在CIFAR-10上训练的线性分类器的训练权重,如图下方。
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

1


  1. 计算机视觉-李飞飞等 ↩︎

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值