国产可图大模型厚积薄发,GLM3加持质的飞跃,ComfyUI最全指南与SD3综合评比孰更强?

Kolors大模型简

就在上周末,国内大厂快手开源了可图大模型文生图模型,这是由快手可图团队开发的基于潜在扩散的大规模文本到 图像生成模型 。

  • • Kolors 是在数10亿图文对下进行训练

  • • 在 视觉质量复杂语义理解文字生成(中英文字符) 等方面,相比于当前业界开源/闭源模型,都展示出了巨大的优势。特别是在中文文字生成方面 领先于当前所有业界模型。

  • • Kolors 支持中英双语 ,在中文特色内容理解 方面更具竞争力。

研发团队构建了一个包含14种垂类,12个挑战项,总数量为一千多个 prompt 的文生图评估集 KolorsPrompts。在 KolorsPrompts
上,并且收集了 Kolors 与市面上常见的 SOTA 级别的开源/闭源系统的文生图结果,并进行了人工评测和机器评测。

人工评测

研发团队邀请了50个业界领域专家对生成图像打分,评估维度包括:画面质量、图文相关性、整体满意度三个方面。结果表明:Kolors
整体满意度方面处于最优水平,其中画面质量显著领先其他模型

机器评测

研发团队采用 MPS(Multi-dimensional Human preference Score) 来模型评估。结果表明:Kolors
实现了最高的MPS 指标,这以结果与人工评估的指标一致。

官方演示
高质量人像

中国元素

复杂 语义理解

文字渲染能力

Kolors大模型ComfyUI安装

当前快手已经提供了在线的Kolors文生图服务可使用,不想本地部署的同学可以使用在线服务体验:https://klingai.kuaishou.com/。

(需要Kolors大模型ComfyUI安装包的同学文末可自行扫描获取)

模型安装

如果需要本地部署,则使用社区的ComfyUI-KwaiKolorsWrapper 插件实现。

  • • 首先需要更新ComfyUI 到最新版本,然后通过ComfyUI插件管理器安装ComfyUI-KwaiKolorsWrapper 。插件地址为:https://github.com/kijai/ComfyUI-KwaiKolorsWrapper。

  • • 下载ChatGLM3 量化模型,并放置在本地目录ComfyUI/models/LLM/checkpoints 。模型地址为:https://hf-mirror.com/Kijai/ChatGLM3-safetensors/tree/main 。这里提供了3种量化权重文件,根据本地显存选择合适模型权重。对于小显存建议直接chatglm3-4bit.safetensors

  • • 下载Kolors模型,本模型会在首次运行时自动下载(切记科学!!! ),并放置在ComfyUI/models/diffusers/Kolors 目录下。模型地址为:https://hf-mirror.com/Kwai-Kolors/Kolors/tree/main。

  • • 加载文末工作流文件 ,然后重启ComfyUI ,即可开始体验。

本地模型结构为:

/ComfyUI/models/LLM/checkpoints  
│   chatglm3-4bit.safetensors  // 4bit、8bit、fb16中选择一个版本  
/ComfyUI/models/diffusers/Kolors  
│   model_index.json  
│  
├───scheduler  
│       scheduler_config.json  
│  
├───text_encoder  
│       config.json  
│       pytorch_model-00001-of-00007.bin  
│       pytorch_model-00002-of-00007.bin  
│       pytorch_model-00003-of-00007.bin  
│       pytorch_model-00004-of-00007.bin  
│       pytorch_model-00005-of-00007.bin  
│       pytorch_model-00006-of-00007.bin  
│       pytorch_model-00007-of-00007.bin  
│       pytorch_model.bin.index.json  
│       tokenizer.model  
│       tokenizer_config.json  
│       vocab.txt  
│  
└───unet  
        config.json  
        diffusion_pytorch_model.fp16.safetensors


![外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传](https://img-home.csdnimg.cn/images/20230724024159.png?origin_url=https%3A%2F%2Fcsdnimg.cn%2Frelease%2Fblogv2%2Fdist%2Fpc%2Fimg%2FnewCodeMoreWhite.png&pos_id=img-3QiRyglW-1739177199828)

  * 1
  * 2
  * 3
  * 4
  * 5
  * 6
  * 7
  * 8
  * 9
  * 10
  * 11
  * 12
  * 13
  * 14
  * 15
  * 16
  * 17
  * 18
  * 19
  * 20
  * 21
  * 22
  * 23
  * 24
  * 25

不同量化模型对应的显存要求如下所示:

文生图工作流

图生图工作流

Kolors与SD3工作流

Kolors和SD3评比体验
01:中文提示语

因为SD3输入提示语理解主要为英文,但Kolors是支持直接中文和英文双语提示 的。SD3并没有收据木牌。

1个中国女孩,手举这木牌,木牌上写着文字“我爱你中华”。身穿中国古风旗袍,淡黄色旗袍,18岁女孩,年轻美貌

SD3效果:

Kolors效果:

02:中文渲染

Kolors中文渲染能力胜出。提示这里也能看出SD3手部问题明显大于 Kolors。但都未很好的解决。笔者抽卡中感觉Kolors
会更容易一些,因为巧妙的藏起来了,特别在后续多人场景更明显。

A Chinese girl holds up a wooden sign with the chinese words “我爱你中华” written
on it. Dressed in ancient Chinese style cheongsam, light yellow cheongsam,

SD3效果:

Kolors效果:

03:中文元素与光影效果

在中文元素方面会Kolors 稍强一些,但在光影效果方面SD3各有千秋。

A young model in Chinese dress poses, in front of divine light with
silhouette light illuminating the edges of the long curly hair, snowflake,
solid color red background, Excellent skin texture, gaze deeply, cheerful
atmosphere, in the style of eye-catching resin jewelry, Beauty product
advertising, photo

SD3效果:

Kolors效果:

04:人物写实

在人物写实艺术感和光影上SD3会更多变彩色元素融合,Kolors 会贴近现实,各有千秋。

masterpiece, best quality, 1girl ((pure gradient background, )), long hair,
floating hair, blush, looking at viewers, happy, ((front)),(upper body),
(studio light), soft light, dark style, night style,Real photography

SD3效果:

Kolors效果:

05:玉莲花

笔者测试SD3中始终无法避免莲花底盘,笔者认为Kolors 会更好些。

Three-dimensional ancient style, dazzling light and shadow, jade carving
technology, jade and jade material, jade carving art composed of lotus and
lotus seed, translucent jade petals, crystal clear texture, transparent
light sense, carved murals, optical fiber effect, simple composition,
commercial photography, studio lighting, luminous three-dimensional
particles, natural light and shadow, beautiful light sense, light tracing,
SSS material, Subsurface Reflection, Bioluminescence, Volume Light, Center
Light, Contour Light, Light Penetration, Octane rendering, Soft focus, Scene
depth, Soft Color, Advanced lighting, Film Light effect,3d rendering, Master
Works, 8K

SD3效果:

Kolors效果:

06:动漫

动漫Kolors 更有质感,Kolors 对NSFW安全更严格。

Animation style, a female character with long, flowing hair that appears to
be made of ethereal, swirling patterns resembling the Northern Lights or
Aurora Borealis. The background is dominated by deep blues and purples,
creating a mysterious and dramatic atmosphere. The character’s face is
serene, with pale skin and striking features. She wears a dark-colored
outfit with subtle patterns. The overall style of the artwork is reminiscent
of fantasy or supernatural genres

SD3效果:

在这里插入图片描述

Kolors效果:

07:复杂提示语理解

复杂文本理解上SD3会稍强一些,Kolors 包含ChatGLM3 LLM大语言加持。但后者能够巧妙的把手部问题隐藏起来,更机智。

3 fashionable young female models in dynamic poses, photorealistic, 8k
resolution: Model 1 wearing a chic blue blouse and red pants, looking over
her shoulder with a confident smile. Model 2 in a tight red mini dress, hair
blowing dramatically as she strikes a playful pose. Model 3 with blue skinny
jeans and a cropped red top, hands on hips exuding youthful attitude.
Vibrant colors, sharp focus, dramatic lighting and depth of field. Capture a
sense of youth, energy and movement in an urban setting like a city street
or rooftop. Pay attention to details like makeup, accessories and fabric
textures. Photographic style, no visible artifacts or unnatural elements.
Aim for a fashionable, trendy and aspirational vibe that could appear in
magazines or advertisements.

SD3效果:

Kolors效果:

总结,综合评估结果笔者感觉如Kolors
的评估结果,对于中文语境的创作会显著优于SD3,特别对中文提示语支持,中文语言了解,以及ChatGLM3大语言模型的加持下。特别是在与可灵图生视频结合,极大的推进了国产AIGC迈进的里程碑。当然这只是感性评估,仁者见仁。

资料软件免费放送

次日同一发放请耐心等待

bb6f9d39f0f7a08f553cb3.png)

Kolors效果:

总结,综合评估结果笔者感觉如Kolors
的评估结果,对于中文语境的创作会显著优于SD3,特别对中文提示语支持,中文语言了解,以及ChatGLM3大语言模型的加持下。特别是在与可灵图生视频结合,极大的推进了国产AIGC迈进的里程碑。当然这只是感性评估,仁者见仁。

资料软件免费放送

次日同一发放请耐心等待

针对各位AIGC初学者,这里列举了一条完整的学习计划,感兴趣的可以阅读看看,希望对你的学习之路有所帮助,废话不多说,进入正题:

请添加图片描述

目标应该是这样的:

第一阶段(30天):AI-GPT从入门到深度应用

该阶段首先通过介绍AI-GPT从入门到深度应用目录结构让大家对GPT有一个简单的认识,同时知道为什么要学习GPT使用方法。然后我们会正式学习GPT深度玩法应用场景。

-----------

  • GPT的定义与概述
  • GPT与其他AI对比区别
  • GPT超强记忆力体验
  • 万能GPT如何帮你解决一切问题?
  • GPT表达方式优化
  • GPT多类复杂应用场景解读
  • 3步刨根问底获取终极方案
  • 4步提高技巧-GPT高情商沟通
  • GPT深度玩法应用场景
  • GPT高级角色扮演-教学老师
  • GPT高级角色扮演-育儿专家
  • GPT高级角色扮演-职业顾问
  • GPT高级角色扮演-专业私人健身教练
  • GPT高级角色扮演-心理健康顾问
  • GPT高级角色扮演-程序UX/UI界面开发顾问
  • GPT高级角色扮演-产品经理
  • GPT高级技巧-游戏IP角色扮演
  • GPT高级技巧-文本冒险游戏引导
  • GPT实操练习-销售行业
  • GPT实操练习-菜谱推荐
  • GPT实操练习-美容护肤
  • GPT实操练习-知识问答
  • GPT实操练习-语言学习
  • GPT实操练习-科学减脂
  • GPT实操练习-情感咨询
  • GPT实操练习-私人医生
  • GPT实操练习-语言翻译
  • GPT实操练习-作业辅导
  • GPT实操练习-聊天陪伴
  • GPT实操练习-育儿建议
  • GPT实操练习-资产配置
  • GPT实操练习-教学课程编排
  • GPT实操练习-活动策划
  • GPT实操练习-法律顾问
  • GPT实操练习-旅游指南
  • GPT实操练习-编辑剧本
  • GPT实操练习-面试招聘
  • GPT实操练习-宠物护理和训练
  • GPT实操练习-吸睛爆款标题生成
  • GPT实操练习-自媒体爆款软件拆解
  • GPT实操练习-自媒体文章创作
  • GPT实操练习-高效写作推广方案
  • GPT实操练习-星座分析
  • GPT实操练习-原创音乐创作
  • GPT实操练习-起名/解梦/写诗/写情书/写小说
  • GPT提升工作效率-Word关键字词提取
  • GPT提升工作效率-Word翻译实现
  • GPT提升工作效率-Word自动填写、排版
  • GPT提升工作效率-Word自动纠错、建议
  • GPT提升工作效率-Word批量生产优质文章
  • GPT提升工作效率-Excel自动化实现数据计算、分析
  • GPT提升工作效率-Excel快速生成、拆分及合并实战
  • GPT提升工作效率-Excel生成复杂任务实战
  • GPT提升工作效率-Excel用Chat Excel让效率起飞
  • GPT提升工作效率–PPT文档内容读取实现
  • GPT提升工作效率–PPT快速批量调整PPT文档
  • GPT提升工作效率-文件批量创建、复制、移动等高效操作
  • GPT提升工作效率-文件遍历、搜索等高效操作
  • GPT提升工作效率-邮件自动发送
  • GPT提升工作效率-邮件自动回复
  • GPT接入QQ与QQ群实战
  • GPT接入微信与微信群实战
  • GPT接入QQ与VX多用户访问实战
  • GPT接入工具与脚本部署实战
第二阶段(30天):AI-绘画进阶实战

该阶段我们正式进入AI-绘画进阶实战学习,首先通过了解AI绘画定义与概述 ,AI绘画的应用领域 ,PAI绘画与传统绘画的区别 ,AI绘画的工具分类介绍的基本概念,以及AI绘画工具Midjourney、Stable Diffusion的使用方法,还有AI绘画插件和模板的使用为我们接下来的实战设计学习做铺垫。

  • -----------
    AI绘画定义与概述
  • AI绘画的应用领域
  • AI绘画与传统绘画的区别
  • AI绘画的工具分类介绍
  • AI绘画工具-Midjourney
  • AI绘画工具-百度文心一格
  • AI绘画工具-SDWebUI
  • AI绘画工具-Vega AI
  • AI绘画工具-微信中的AI绘画小程序
  • Midjourney学习-Discord账号的注册
  • Midjourney Bot界面讲解
  • Midjourney提示词入门
  • Midjourney高级提示词
  • Midjourney版本参数学解读
  • Midjourney功能参数
  • Midjourney上采样参数
  • AI绘画组合应用1-Midjourney + GPT
  • AI绘画组合应用2-Stable Diffusion + GPT
  • AI绘画组合应用3-AI绘画+ GPT +小红书
  • AI绘画组合应用4-AI绘画+ GPT +抖音
  • AI绘画组合应用5-AI绘画+ GPT +公众号
  • AI绘画组合应用6-AI绘画+ GPT + AI视频
  • AI绘画组合应用7-AI绘画+ GPT + 小说人物/场景
  • AI绘画设计-Logo设计
  • AI绘画设计-套用万能公式
  • AI绘画设计-引用艺术风格
  • AI绘画设计-GPT加速设计方案落地
  • AI绘画设计-Vega AI渲染线稿生成设计
  • AI绘画设计-摄影
  • AI绘画设计-头像设计
  • AI绘画设计-海报设计
  • AI绘画设计-模特换装
  • AI绘画设计-家具设计
  • AI绘画设计-潘顿椅设计
  • AI绘画设计-沙发设计
  • AI绘画设计-电视柜设计
  • AI绘画设计-包装设计的提示词构思
第三阶段(30天):AI-视频高段位

恭喜你,如果学到这里,你基本可以找到一份AIGC副业相关的工作,比如电商运营、原画设计、美工、安全分析等岗位;如果新媒体运营学的好,还可以从各大自媒体平台收获平台兼职收益。

到此为止,大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗?

  • -----------
    AI视频定义与概述
  • AI视频制作-方案与创新
  • AI视频制作-各种工具实操
  • AI视频制作-美学风格(油画/插画/日漫/水墨)
  • AI视频制作-形象设定(人物形象服装/造型/表情)
  • AI视频画面特效处理
  • AI视频画面拼接
  • AI视频画面配音
  • AI视频画面包装
  • AI视频锁定人物逐一精修
  • 多种表情动作/情节
  • 动态模型转换-视频内部元素关键帧
  • 动态模型转换-图像整体运动
  • 动态模型转换-虚拟人
  • 动态模型转换-表面特效
  • AI自媒体视频-深问GPT,获取方案
  • AI自媒体视频-风格设置(诗歌/文言文等)
  • AI自媒体视频-各行业创意视频设计思路
  • AI视频风格转换
  • AI视频字数压缩
  • AI视频同类型衍生
  • AI视频Pormpt公式
第四阶段(20天):AI-虚拟数字人课程
  • -----------
    AI数字人工具简介
  • AI工作台界面功能展示及介绍
  • AI数字人任务确定
  • AI数字人素材准备
  • AI知识、语料的投喂
  • AI模型训练
  • AI训练成果展示及改进
  • AI数字人直播系统工具使用
  • AI人物在各平台直播
  • AI数字人在OBS平台直播
第五阶段(45天以上):AIGC-多渠道变现课程

该阶段是项目演练阶段,大家通过使用之前学习过的AIGC基础知识,项目中分别应用到了新媒体、电子商务等岗位能帮助大家在主流的新媒体和电商平台引流和带货变现。

-----------

  • AI-小红书引流变现
  • AI-公众号引流变现
  • AI-知乎引流变现
  • AI-抖音引流/带货变现
  • AI-写作变现
  • AI-B站引流变现
  • AI-快手引流变现
  • AI-百家号引流变现
  • AI-制作素材模板出售变现
  • AI-周边定制变现
  • AI-手机壳图案定制变现
  • AI-周边产品定制变现
  • AI-服装图案定制变现
  • AI-个性头像定制变现
  • AI-起号与知识付费变现
  • AI-实现淘宝销售变现

学习是一个过程,只要学习就会有挑战。天道酬勤,你越努力,就会成为越优秀的自己。

如果你能在15天内完成所有的任务,那你堪称天才。然而,如果你能完成 60-70% 的内容,你就已经开始具备成为一名AIGC的正确特征了。

这份完整版的AIGC资料我已经打包好,需要的点击下方二维码,即可前往免费领取!

请添加图片描述

在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值