【吴恩达deeplearning.ai】4.2 One-Shot 学习

why do not

已于 2022-02-24 11:08:53 修改

阅读量261

点赞数

分类专栏：吴恩达深度学习文章标签：人工智能深度学习计算机视觉人脸识别

于 2022-02-24 10:59:55 首次发布

本文链接：https://blog.csdn.net/qq_42994177/article/details/123068282

版权

吴恩达深度学习专栏收录该内容

83 篇文章 24 订阅

订阅专栏

←上一篇	↓↑	下一篇→
4.1 什么是人脸识别？	回到目录	4.3 Siamese 网络

One-Shot 学习 (One-Shot Learning)

人脸识别所面临的一个挑战就是你需要解决一次学习问题，这意味着在大多数人脸识别应用中，你需要通过单单一张图片或者单单一个人脸样例就能去识别这个人。而历史上，当深度学习只有一个训练样例时，它的表现并不好，让我们看一个直观的例子，并讨论如何去解决这个问题。
在这里插入图片描述
假设你的数据库里有4张你们公司的员工照片，实际上他们确实是我们deeplearning.ai的员工，分别是Kian，Danielle，Younes和Tian。现在假设有个人（编号1所示）来到办公室，并且她想通过带有人脸识别系统的栅门，现在系统需要做的就是，仅仅通过一张已有的Danielle照片，来识别前面这个人确实是她。相反，如果机器看到一个不在数据库里的人（编号2所示），机器应该能分辨出她不是数据库中四个人之一。
在这里插入图片描述
所以在一次学习问题中，只能通过一个样本进行学习，以能够认出同一个人。大多数人脸识别系统都需要解决这个问题，因为在你的数据库中每个雇员或者组员可能都只有一张照片。

有一种办法是，将人的照片放进卷积神经网络中，使用softmax单元来输出4种，或者说5种标签，分别对应这4个人，或者4个都不是，所以softmax里我们会有5种输出。但实际上这样效果并不好，因为如此小的训练集不足以去训练一个稳健的神经网络。
在这里插入图片描述
而且，假如有新人加入你的团队，你现在将会有5个组员需要识别，所以输出就变成了6种，这时你要重新训练你的神经网络吗？这听起来实在不像一个好办法。

Similarity函数

在这里插入图片描述
所以要让人脸识别能够做到一次学习，为了能有更好的效果，你现在要做的应该是学习Similarity函数。详细地说，你想要神经网络学习这样一个用 $d$ 表示的函数， d(img1,img2)=degree of difference between images ，它以两张图片作为输入，然后输出这两张图片的差异值。如果你放进同一个人的两张照片，你希望它能输出一个很小的值，如果放进两个长相差别很大的人的照片，它就输出一个很大的值。所以在识别过程中，如果这两张图片的差异值小于某个阈值 $τ$ ，它是一个超参数，那么这时就能预测这两张图片是同一个人，如果差异值大于 $τ$ ，就能预测这是不同的两个人，这就是解决人脸验证问题的一个可行办法。
在这里插入图片描述
要将它应用于识别任务，你要做的是拿这张新图片（编号6），然后用 $d$ 函数去比较这两张图片（编号1和编号6），这样可能会输出一个非常大的数字，在该例中，比如说这个数字是10。之后你再让它和数据库中第二张图（编号2）片比较，因为这两张照片是同一个人，所以我们希望会输出一个很小的数。然后你再用它与数据库中的其他图片（编号3、4）进行比较，通过这样的计算，最终你能够知道，这个人确实是Danielle。