1、简介
2025.01.27: Janus-Pro发布,Janus的高级版本,显著提高了多模态理解和视觉生成。
Janus-Pro 是 Janus 的高级版本。具体来说, Janus-Pro 包括以下改进:优化的训练策略、 扩展的训练数据以及更大规模的模型。通过这些改进, Janus-Pro 在多模态理解和文本生成图像的指令跟 随能力上取得了显著进步,同时还提升了文本生成图像的稳定性。
git连接
Janus 是一种新颖的自回归框架,它统一了多模态理解和生成。它通过将视觉编码解耦为单独的路径来解决以前方法的局限性,同时仍然使用单一、统一的 transformer 架构进行处理。这种解耦不仅缓解了视觉编码器在理解和生成中的角色冲突,也增强了框架的灵活性。Janus 超越了以前的统一模型,并达到或超过特定于任务的模型的性能。Janus 的简单性、高度灵活性和有效性使其成为下一代统一多模态模型的有力候选者。
Janus模型运行硬件要求
,Janus Pro对硬件要求较低,以下是1B模型和7B模型运行的GPU显存占用情况: