【计算机视觉与深度学习 北京邮电大学 鲁鹏 视频笔记】1. 线性分类器

视频连接 https://www.bilibili.com/video/BV1V54y1B7K3?p=2&spm_id_from=pageDriver

1. 前言

1.1 数据驱动的图像分类方法

  1. 数据集构建
  2. 分类器设计与学习
  3. 分类器决策

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

1.2 常用分类任务的指标

在这里插入图片描述
在这里插入图片描述

2. 线分类器

在这里插入图片描述

2.1 基于图像的表示

2.1.1 图像类型

  1. 二进制图像
    非黑即白,0表示黑,1表示白
    在这里插入图片描述
  2. 灰度图像
    每一个像素点由(0-255)表示,0是最黑,255是最白
    在这里插入图片描述
  3. 彩色图像
    RGB三个通道每种颜色0-255
    在这里插入图片描述

2.1.2 图像表示

大多数的算法都要求输入向量
将图像转换成向量的方法有很多,最简单的方法就是直接将图像矩阵转换成向量
在这里插入图片描述
有一张32*32的彩色图像转换成向量是多少维度?
在这里插入图片描述

2.2 线性分类器

为什么从线性分类器开始

  • 形式简单易于理解
  • 通过层级结构(神经网络)或者高维映射(支撑向量机)可以形成功能强大的非线性模型

2.2.1 什么是线性分类器

线性分类器是一种线性映射,将输入的图像特征映射为类别分数

2.2.2 线性分类器的定义

在这里插入图片描述

2.2.3 线性分类器的决策

在这里插入图片描述

线性分类器示例

  • 任务:为图片分配类别标签(汽车类、猫类、鸟类)
    在这里插入图片描述
    线性分类器决策步骤:
  1. 将图像表示成向量
  2. 计算当前图片每个类别的分数
  3. 按类别得分判定当前图像
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    线性分类器的矩阵表示为
    在这里插入图片描述

2.2.4 线性分类器的权值向量

在这里插入图片描述

2.2.5 线性分类器的决策边界

在这里插入图片描述

3 损失函数

3.1 损失函数的定义

  • 什么是损失函数? 损失函数搭建了模型性能与模型参数之间的桥梁,指导模型参数的优化。
  1. 损失函数是一个函数,用于度量给定分类器的预测值与真实值的不一致程度,其输出通常是一个非负实值
  2. 其输出的非负实值可以作为反馈信号来对分类器参数进行调整,以降低当前示例对应的损失值提升分类器的分类效果

损失函数的一般定义为:
在这里插入图片描述

3.2 多类支撑向量机损失

重新说明
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
用图来表示,X轴表示Syi,Sij是固定值,折线为45度角
在这里插入图片描述

max(0,.)损失-常称为折页损失
举例:
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
问答:
在这里插入图片描述

  • 答案
  1. 最大是无穷、最小是0
  2. 在是个类别的样本中,极端情况下假设w和b都设为0,那么Li为9。平均损失L也为9。这个值可以作为我门编码的评判,初始化w和b很小时,损失L应该是接近分类别数减1,也就是这个样本中接近9。
  3. 大1
  4. 放大了N倍
  5. 对模型有影响

3.3 正则项多参数

3.3.1 正则项及损失

在这里插入图片描述
问题:假设存在一个W使损失函数L=0,这个W是唯一的吗?
在这里插入图片描述
答: 不唯一,因为W2同样有L=0,应该如何在W1和W2做出选择?

  • 由此引入正则项
    在这里插入图片描述
    在这里插入图片描述

3.3.2 超参数

在这里插入图片描述

3.3.3 L2正则项损失

在这里插入图片描述

  • 正则项损失有主要三个作用
  1. 让损失解唯一
  2. 防止模型过拟合
  3. 让模型有了偏好,喜欢 权值分散的

3.3.4 常用的正则项损失

在这里插入图片描述

4. 优化算法

4.1 什么是参数优化

参数优化是机器学习的核心步骤之一,它利用损失函数的输出作为反馈信号调整分类器参数,以提升分类器对训练样本的预测性能

4.2 优化算法的目标

在这里插入图片描述
由此引入梯度下降方法

4.3 梯度下降算法

  • 一种简单而高效的迭代优化方法!
    在这里插入图片描述
    在这里插入图片描述

4.3.1 梯度计算

在这里插入图片描述
在这里插入图片描述

  • 梯度计算总结
    在这里插入图片描述

4.3.2 梯度计算算法的计算效率

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
一个epoch=N/m;

  • 最后总结
    在这里插入图片描述

五、数据集划分

在这里插入图片描述
但是如果样本很少的话,那么可能验证集包含的样本就太少,从而无法在统计
上代表数据。
这个问题很容易发现:如果在划分数据前进行不同的随机打乱,最终得到的
模型性能差别很大,那么就存在这个问题。
由此引入k折交叉验证(除测试集以外,所有的样本划分为训练集和验证集,划分为几份就是几折)
在这里插入图片描述
另外还有带有打乱数据的重复K折验证
分划分训练一次,就打乱数据重新划分,进行下一次
在这里插入图片描述

六、数据预处理

数据能否直接使用,有哪些处理方式?

  • 方法一:
    在这里插入图片描述
  • 方法二
    在这里插入图片描述
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值