免费、开源!快手可图Kolors,一款会写汉字、最懂中文的文生图大模型!

大家好,我是程序员X小鹿,前互联网大厂程序员,自由职业2年+,也一名 AIGC 爱好者,持续分享更多前沿的「AI 工具」和「AI副业玩法」,欢迎一起交流~

前段时间分享了一款 AI 绘画工具,深受大家喜爱。甚至几年都没联系的前同事,都发消息问我,这个 AI 工具是啥?

在这里插入图片描述

像上面这组图,就是用这个 AI 绘画工具画的。

比如一些职场吐槽、职场反内卷的插画,还是非常容易引起打工人的共鸣的。

用来做自媒体账号、发朋友圈、做文章插图,都可以!比如X小鹿就经常用它来生成文章插图。

之前问的人太多,回复不过来了,就放公众号了,需要的话发送【插图】自取吧~

但是这个 AI 工具有一定免费额度,免费体验次数用完了,就需要付费了。

有网友就问,有免费的吗?

当然有呀!

免费的就用奇域AI呗。每天签到可领 100 积分,每天可画 100 张。大部分用户绝对够画了。

但是要画出一样的效果,需要自己调提示词。出图后,还需要自己把文字 P 上去。

除了奇域AI,如果会 Stable Diffusion,本地部署出图,也是免费的。而且我见有网友在 LibLib 上发了相关 Lora,可以跑跑试试看。

但依然需要后期自己把文字 P 上去。

因为很多 AI 绘画工具,是不支持图片上出文字的,比如像下面这个:

提示词:一只柯基狗的侧面,头顶上方写着“你瞅啥”。

发现它完全不理解。

在这里插入图片描述

虽然已经有一些工具目前是支持文本输出的,但对于汉字的输出,可控性并不是很高。

前几天在 WAIC 2024 的大会上,快手公布了「可灵 AI」的 Web 端平台以及最新功能。

快手可灵的 AI 视频,备受大家喜爱,不仅国内出圈了,还火到了国外,估计快手自己也是没有料到。

但,大家是不是太宠幸「可灵」AI 视频了,而忘了还有「可图」 AI 绘画。

快手可图大模型(Kolors),是快手大模型团队研发的图像生成大模型,也是行业顶尖的图像生成大模型。

在 WAIC 大会上,快手团队称:

可图大模型(Kolors)是最懂中文的文生图模型!综合指标超过 SDXL / SD3 等开源模型和 Midjourney 等闭源模型。

目前可图(Kolors)完全开源,而且 ComfyUI 插件也出了。

开源地址:

https://github.com/Kwai-Kolors/Kolors

但如果不懂技术也没有关系,可以直接在「可灵AI」官网体验。

https://klingai.kuaishou.com/

在这里插入图片描述

快手的可图(Kolors),能够很好地理解中文语义,并且可以直接生成汉字!

比如像刚刚出图失败的文字「你瞅啥」,这里用可图再试一下:

在这里插入图片描述

发现汉字出得还不赖!

在这里插入图片描述

又试了几个 Case,还不错:

在这里插入图片描述

在这里插入图片描述

不过有时候也会出汉字失败,尤其是文字比较长的时候。像下面这张。

想让一只小猫咪说「你瞅啥」,另一只说「瞅你咋滴」。但这貌似对可图来说,有些困难。

呃,你俩这是说了个啥…

在这里插入图片描述

但不管怎么说,已经比之前的文生图大模型有了很大进步。

快手的可图,不仅会写汉字,而且

1、支持多种风格的绘画。

2、也支持垫图。

3、最多可一次出 9 张图。

4、速度还贼快,差不多 10 多秒就能出图。

而且现在是完全免费!

后续是否收费或是否也会采用积分制,就看官方了,但至少目前可「免费无限出图」!

感兴趣的快去玩一下吧~

结束语

之前在知乎上看到一个提问,说可灵大模型是否已经超越美国了。

我觉得不敢说是否已经超过了,但肯定已经跻身世界前列了!而且在其他 AI 领域的差距也在慢慢缩小。

相信国产大模型一定会更加出色。一起期待一下~


觉得文章有帮助,请帮忙点赞收藏关注一下呦~

我是程序员X小鹿,前互联网大厂程序员,自由职业2年+,也是一名 AIGC 爱好者,欢迎一起交流~

AI及副业资料,关注下方公众号,回复【资料】领取。

在这里插入图片描述

### 如何部署 Kolors #### 下载与安装 为了成功部署 Kolors 模型,需按照官方提供的指南完成必要的准备工作。首先通过 Git 将模型仓库克隆至本地环境: ```bash git clone https://huggingface.co/Kwai-Kolors/Kolors ``` 随后,将下载的文件存储到指定路径下以便后续调用,具体路径应为 `comfyUI\Models\diffusers\kolors` [^2]。 #### 软件依赖配置 在实际运行之前,确保已正确设置 Python 环境并安装所需库。推荐使用虚拟环境来管理项目依赖项。以下是典型的依赖列表及其安装命令: ```bash pip install torch torchvision transformers diffusers accelerate safetensors gradio ``` 这些工具包涵盖了深度学习框架支持、像处理以及交互界面构建等功能需求 [^1]。 #### 运行服务端程序 当所有前期准备完成后,可以通过执行脚本来启动 Web UI 接口供用户提交请求。通常情况下会有一个名为 `webui.py` 的入口文件负责初始化整个应用流程: ```python from launch import start_server if __name__ == "__main__": start_server() ``` 上述代码片段展示了如何定义主函数以触发服务器进程 。 #### 测试实例验证效果 后一步是对新搭建的服务进行全面测试,确认其能够正常响应各类输入数据。可以尝试提供一段描述性的文字作为样例查询参数发送给 API 终端观察返回结果是否满足预期标准 。 ```python import requests url = 'http://localhost:7860/txt2img' payload = {"prompt": "a beautiful sunset over the mountains"} response = requests.post(url, json=payload) with open('output.png', 'wb') as f: f.write(response.content) ``` 以上即完成了从获取资源直至功能检验全过程概述。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

程序员X小鹿

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值