厨艺速成「秘籍」—— 跨模态菜谱检索 | 复旦大学陈静静

智源社区

于 2022-04-30 11:30:00 发布

阅读量420

点赞数

文章标签：大数据 python 计算机视觉机器学习人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/BAAIBeijing/article/details/124521870

版权

导语：看到一道菜的成色，就能得知食材原料和烹饪方法？

在近期的AI TIME 青年科学家——AI 2000 学者专场论坛系列报告中，来自复旦大学计算机科学学院的助理教授陈静静博士带来了题为「跨模态菜谱检索」的演讲，从「基于识别的菜谱检索」、「基于跨模态学习的菜谱检索」、「跨域食物迁移」等方面介绍了跨模态菜谱检索任务几年来的前沿研究工作，讨论了该领域未来的研究方向。（回放：https://event.baai.ac.cn/activities/346）

陈静静，复旦大学计算机科学技术学院青年副研究员、上海高层次海外人才、浦江人才计划入选者、ACM China上海新星奖获奖者，累计发表学术论文 30 余篇，曾获ACM Multimedia 2016最佳学生论文奖、Multimedia Modeling 2017 最佳学生论文奖，担任多个国际知名期刊审稿人，以及国际会议领域主席/程序委员会委员。

整理：熊宇轩

编辑：李梦佳

01

定义与挑战

在「跨模态菜谱检索」任务中，给定一张菜品的图像作为模型的输入查询，模型需要检索出制作该菜品相应的菜谱，我们可以将该过程建模为「视觉-文本」的翻译。这项技术可以帮助我们进一步完成实物识别、营养成分估计、菜谱推荐等下游任务。

从技术角度来说，「跨模态菜谱检索」任务要求我们首先识别菜品，再将输入图像与菜谱文本关联起来，并且针对结构化的菜谱文本学习高质量表征。因此，该任务涉及到图像识别与理解、跨模态学习、菜谱文本建模等研究领域。

挑战——食物图像理解

与普通的自然图像相比，实物图像的理解面临着一些独特的挑战。颜色、光照、食材成分、切菜方法等因素都会导致菜品外观存在差异，影响模型对食物的识别效果。

具体到食材成分识别环节，切菜（切片、切丝、切丁等）的方式会导致同一种食材的形状存在较大差异。值得一提的是，

最低0.47元/天解锁文章

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
厨艺速成「秘籍」—— 跨模态菜谱检索 | 复旦大学陈静静

导语：看到一道菜的成色，就能得知食材原料和烹饪方法？在近期的AI TIME 青年科学家——AI 2000 学者专场论坛系列报告中，来自复旦大学计算机科学学院的助理教授陈静静博士带来了题为「跨模态菜谱检索」的演讲，从「基于识别的菜谱检索」、「基于跨模态学习的菜谱检索」、「跨域食物迁移」等方面介绍了跨模态菜谱检索任务几年来的前沿研究工作，讨论了该领域未来的研究方向。（回放：h...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。