论文阅读:Deep-based Ingredient Recognition for Cooking Recipe Retrieval
阅读该论文为一个课程的阅读大作业。由于博主的研究方向也不是该方向,所以在该篇文章只关注于该篇论文的方法部分,而相关工作,数据集与实验则不是该篇文章的重点。但是如果读者是做这一方面的研究,建议去熟悉一下作者用到的几个数据集并分析在各个数据集上的实验结果。
面向的问题
1 问题简介
首先该论文处理的问题为食谱检索。具体为给出一张拍摄的含有菜肴的图像,需要在数据库中找出该菜肴的名称以及其菜谱。
2 应用
检索食谱可以应用在很多的食品类健康类的app上,用于来估计营养或者快速给出食谱。
方法
1 创新点
- 之前处理该类问题的一般手段是从图像出发直接预测食谱名称。这种方法首先其性能表现较差,另外不在其训练集中的食谱该方法一定预测不出正确结果。鉴于之前的方法的缺点,本文作者在预测食谱名称的同时也会预测图像中的食材种类。即在原来的单标签分类问题上扩展为一个单标签和一个多标签分类问题。这样做的好处首先是食材的种类远少于食谱的种类(因为食谱本质上是多种食材的组合),所以更容易将预测的食材结果应用到零样本检索问题上从而使得该方法可以预测未在训练集中的食谱名称;其次,预测出的食材种类也能作为辅助信息提升食谱的检索性能。下图展示了食材检索的高难度,在同一种菜肴中辅助性的食材也可能不一样。