前言
Janus-Pro这款参数仅为7B,不仅支持图像生成,还具备多模态理解能力,该模型能够根据文本描述生成图像,并理解图像内容进行对话。
2025年1月28日凌晨,中国AI公司DeepSeek开源了多模态模型Janus-Pro-7B。这款模型在GenEval和DPG-Bench两大权威测试中,击败了OpenAI的DALL·E 3和Stable Diffusion等业界标杆,展现了其卓越的性能和潜力。
所有的AI设计工具,安装包、模型和插件,都已经整理好了,👇获取~
Janus-Pro 官方说明
J****anus-Pro-7B 的主要特点:
1.强大的性能:
在GenEval和DPG-Bench两大权威测试中,Janus-Pro-7B的表现超越了DALL·E 3和Stable Diffusion等业界标杆,展示了其在图像生成和多模态理解方面的强大能力。
2.多模态理解:
该模型不仅能够生成高质量的图像,还能理解多种模态的数据,如文本、图像、音频等,实现了更丰富的交互和应用。
3、高效运行:
尽管参数仅为7B,Janus-Pro-7B能够在普通高端电脑上运行,大大降低了使用门槛,使得更多的开发者和研究人员能够轻松上手和应用。
4.开源:
DeepSeek选择开源Janus-Pro-7B,这一举措将极大地促进全球AI社区的发展,鼓励更多的创新和合作。
Janus-Pro 插件安装
首先,我们需要安装 Janus-Pro 插件,在管理器中搜索:Janus-Pro
插件地址:https://github.com/CY-CHENYUE/ComfyUI-Janus-Pro
插件安装完成后重启ComfyUI。
接下来还需要下载模型:Janus-Pro模型,不方便下载的可到文末网盘获取模型。
官方目前有7B和1B参数模型,我们下载7B的。
地址:https://huggingface.co/deepseek-ai/Janus-Pro-7B/tree/main
模型放到**/ComfyUI/models/Janus-Pro//Janus-Pro-7B/**下
Janus-Pro 体验
工作流支持图片反推和文生图功能。
文生图目前分辨率只有384X384,现在效果比较一般,等待官方升级。
图片反推:左下角是原图,右上角是反推生成的图片。
为了帮助大家更好地掌握 ComfyUI,我在去年花了几个月的时间,撰写并录制了一套ComfyUI的基础教程,共六篇。这套教程详细介绍了选择ComfyUI的理由、其优缺点、下载安装方法、模型与插件的安装、工作流节点和底层逻辑详解、遮罩修改重绘/Inpenting模块以及SDXL工作流手把手搭建。
由于篇幅原因,本文精选几个章节,详细版点击下方卡片免费领取
一、ComfyUI配置指南
- 报错指南
- 环境配置
- 脚本更新
- 后记
- …
二、ComfyUI基础入门
- 软件安装篇
- 插件安装篇
- …
三、 ComfyUI工作流节点/底层逻辑详解
- ComfyUI 基础概念理解
- Stable diffusion 工作原理
- 工作流底层逻辑
- 必备插件补全
- …
四、ComfyUI节点技巧进阶/多模型串联
- 节点进阶详解
- 提词技巧精通
- 多模型节点串联
- …
五、ComfyUI遮罩修改重绘/Inpenting模块详解
- 图像分辨率
- 姿势
- …
六、ComfyUI超实用SDXL工作流手把手搭建
- Refined模型
- SDXL风格化提示词
- SDXL工作流搭建
- …
由于篇幅原因,本文精选几个章节,详细版点击下方卡片免费领取