厨艺速成「秘籍」—— 跨模态菜谱检索 | 复旦大学陈静静

导语:看到一道菜的成色,就能得知食材原料和烹饪方法?

在近期的AI TIME 青年科学家——AI 2000 学者专场论坛系列报告中,来自复旦大学计算机科学学院的助理教授陈静静博士带来了题为「跨模态菜谱检索」的演讲,从「基于识别的菜谱检索」、「基于跨模态学习的菜谱检索」、「跨域食物迁移」等方面介绍了跨模态菜谱检索任务几年来的前沿研究工作,讨论了该领域未来的研究方向。(回放:https://event.baai.ac.cn/activities/346)

44b31e583c19600f8b9f5c41c5ea8fce.png

陈静静,复旦大学计算机科学技术学院青年副研究员、上海高层次海外人才、浦江人才计划入选者、ACM China上海新星奖获奖者,累计发表学术论文 30 余篇,曾获ACM Multimedia 2016最佳学生论文奖、Multimedia Modeling 2017 最佳学生论文奖,担任多个国际知名期刊审稿人,以及国际会议领域主席/程序委员会委员。

整理:熊宇轩

编辑:李梦佳

01

定义与挑战

786645c5cf8a29d36eda8f6b04e8dc6d.png

在「跨模态菜谱检索」任务中,给定一张菜品的图像作为模型的输入查询,模型需要检索出制作该菜品相应的菜谱,我们可以将该过程建模为「视觉-文本」的翻译。这项技术可以帮助我们进一步完成实物识别、营养成分估计、菜谱推荐等下游任务。

从技术角度来说,「跨模态菜谱检索」任务要求我们首先识别菜品,再将输入图像与菜谱文本关联起来,并且针对结构化的菜谱文本学习高质量表征。因此,该任务涉及到图像识别与理解、跨模态学习、菜谱文本建模等研究领域。

  • 挑战——食物图像理解

614264a495c5a8e462f7483acae01c21.png

与普通的自然图像相比,实物图像的理解面临着一些独特的挑战。颜色、光照、食材成分、切菜方法等因素都会导致菜品外观存在差异,影响模型对食物的识别效果。

4842d9ce5c88cea149268a16daec8e73.png

具体到食材成分识别环节,切菜(切片、切丝、切丁等)的方式会导致同一种食材的形状存在较大差异。值得一提的是,

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值