毕设论文研读①---基于原型网络的小样本图像识别方法

参考论文:基于原型网络的小样本图像识别方法

引言部分

针对小样本数据集的图像分类方法大致可分为两类:
①传统机器学习:形状及色域变化,需要解决特征协方差矩阵的不稳定性和奇异性
②基于深度卷积神经网络的图像识别算法:迁移学习、图神经网络、度量学习等,利用卷积神经网络的多层结构将图像的底层特征抽象为高层特征,使模型具有更高效的特征学习能力

本文以度量学习模型为基础


//度量学习模型[1]

度量
在数学中,一个度量是一个定义集合中元素之间距离的函数。一个具有度量的集合被称作度量空间。

度量学习
假设我们需要计算图像之间的相似度,那么就需要构建一个距离函数去强化合适的特征。我们可以在特定的任务通过选择合适的特征并手动构建距离函数。然而这种方法会需要很大的人工投入,也可能对数据的改变非常不鲁棒。度量学习作为一个理想的替代,可以根据不同的任务来自主学习出针对某个特定任务的度量距离函数。


本文提出了一种基于多层卷积神经网络的原型网格模型


//卷积神经网络[2][3]

将图像拆分成对应的特点,被称为卷积核。然后查看被识别图像有无对应的卷积核来确认是否为目标物体。即滤波。
用卷积核扫描目标图得出的一个二维图为特征图。
但是这样的话,岂不是有多少个卷积核就要扫描多少遍?
对于一个有大量细节,或者说相当数量分层级的细节来说,这样算法的复杂度是很高的。
所以有池化(pooling)。即缩小特征图(Feature Map)
有最大池化:选择被扫描区域内的最大值
平均池化:取被扫描区域内的平均值 等池化方式
在处理边缘时的操作称为(Padding)
如果对图像采用最大池化,则在边缘补零来提取边缘特征
池化要求一定要保留原特征图的特征
卷积计算中的一个基本流程为:卷积,ReLU(修正线性单元),池化(下采样),可以多次重复进行。
然后把得到的最简单的特征图们展开得到一条特征数组(排成一列)
然后就是全链接的操作,对数组按目标图的数组权值操作得到一个判断是否为目标的概率数。
在这里插入图片描述

用大数据修正卷积核和全链接的行为叫机器学习
然后用反向传播(backpropagation)的算法不断修正用来处理特征数组的权链接。
反向传播算法
正向传播求损失,反向传播回传误差。
神经网络每层的每个神经元都可以根据误差信号修正每层的权重。

把神经网络得到的结果和真实的结果进行误差计算,称为损失函数,我们需要把损失函数降到最低,得到令人满意的网络。
所以甚至一开始的卷积核和全链接是随机的,只要给出的数据和反馈足够多,仍然可以得到正确的算法网络。但需要提前给出卷积核的尺寸、数目、大小、池化步长大小等,即搭出一个合适的框架。

MINST数据集训练过程可视化,3D:https://www.cs.ryerson.ca/~aharley/vis/conv/


1、原型神经网络

原型网络

将复杂的分类问题转化成在特征向量空间中的最近邻问题。在嵌入空间中,每个类别都有一个原型点。我们把图像迎入到嵌入空间中,此时空间中训练集的平均值就是类的原型。把每个样本进行聚类,预测分类的时候把测试图像也映入进去,计算与原型点之间的距离,进行分类。

Adam优化算法

参考文献:
[1]度量学习(metric learning)

[2]大白话讲解卷积神经网络工作原理

[3]双语字幕】据说这是讲的最好的卷积神经网络入门

  • 1
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值