- 博客(2)
- 收藏
- 关注
原创 Omni-Dish: Photorealistic and Faithful Image Generation and Editing for Arbitrary Chinese Dishes
菜品图像在数字时代扮演着至关重要的角色,随着食品行业和电子商务的数字化,对具有文化特色的菜品图像的需求不断增加。为了解决这一局限性,我们提出了Omni-Dish,这是第一个专门为中国菜量身定制的文本到图像生成模型。此外,我们引入了一种重新描述策略,并采用粗到细的训练方案,以帮助模型更好地学习细致的烹饪细节。在推理过程中,我们利用预构建的高质量标题库和大型语言模型增强用户的文本输入,从而实现更具照片真实感和忠实度的图像生成。此外,为了扩展我们模型在菜品编辑任务中的能力,我们提出了概念增强的P2P。
2025-05-03 17:32:44
211
原创 DiffusionDet:生成模型方法用于目标检测(Object Detection)
# 1 Abstract 作者提出了DiffusionDet模型。训练时,扩散过程,模型从ground truth的box开始加noise;反向过程,模型学习去噪。推理时,模型将一组随机生成的box逐步refine成output。 作者的两个发现: 1. Random boxes,although drastically different from pre-defined anchors or learned queries, are also e
2023-02-28 14:58:49
1364
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人