可灵之后,快手又一最新明星产品:告别鬼画符,一键生成理想图像

近期,快手平台又又又成为了焦点。

就在OpenAI 当家花旦 Sora 的公测还遥遥无期时,快手就率先祭出了对标的当家产品可灵。得益于其逼真、高清和与Sora不相上下的视觉表现,它迅速赢得了全球网民的喜爱。根据快手的数据,可灵的申请用户已经达到了近70 万,而现在已经有超过30 万的用户可以使用它。

而趁着市场的热度高居不下,快手迅速地推出了可灵的网页版本,其中便包含了它的另一最新产品 —— 可图,也就是本文重点介绍的对象。在刚结束不久的 2024 世界人工智能大会上,快手宣布自研文生图大模型可图正式开源,已经登录可灵AI网站且可供免费使用。

实操:中英拼写毫无压力 还可以一键生成视频

虽然大模型看上去能说会道,其实此前还是个不会写字的“文盲”,无论是汉字还是英文,只要 AI 生成的,八成是难以言表的“鬼画符”。像是这样的:

1f12471c05d235121e9fd9c54436e5bb.jpeg

而可图大模型不仅能刻画丰富的细节,进行多种风格转化,其最大的亮点是 ——会写字!

据介绍,可图支持中英文双语,生成效果比肩 Midjourney-v6 水平,具备英文和中文写字能力。其中,为了更好地理解中文,快手称可图大模型通过数十亿中文语料的训练,构建了一个强大的中文 CLIP 模型。其使用方法也很简单。点击可灵网页版链接,进入操作界面后,选择“AI 图片”选项,用户只需输入提示词、调整比例大小或者上传参考图。其中可图支持长达 256 字符的文本输入。

31862ae89449b6ecb211af363935c8e0.jpeg

文生文

例如,我们输入提示词:复古摄影写真,80年代的MTV风格,多巴胺的色彩装饰,背景是室内复古电视,电视中写着中文“AI研究”,一把绑着粉色蝴蝶结的叉子,一个草莓蛋糕,电视广告,80年代流行文化,柔光。

d0c2d287fe3441a9ddea8420b07a3cf8.jpeg

提示词:可爱的柴犬,穿着西装,一只手托着酒杯,另一只手拿着玫瑰花。角色扮演游戏,色彩鲜艳,对比度高,印刷纹理。特写摄影,具有表现力的姿势,柔和的深色背景。

50865920140eb1d062db66890fd62b72.jpeg

图生图功能可图还具备图生图功能,直接上传一张参考图片,然后输入提示词即可。

e8b0fc95a64570ccf0dd5ba59146fb9c.jpeg

最终生成效果如下:

fdf055209b4659105e57bf506f1e5085.jpeg

由于搭载在可灵网页版上,可图还可以将生成的图片直接进行图生图。例如,我们输入提示词:毛毡艺术,高清,毛毡材质,高级滤镜,可爱,卡通,羊毛毡娃娃,名画,梵高的自画像。十几秒即可得到以下成果:

2a167e02ea06ea986a659a42a4219246.jpeg

接着在生成的图片中点击「垫图」,即可使用参考图功能。我们继续输入提示词:小羊抱着一束玫瑰花,设置完参数,就能生成新图片。

b47c9cf7b77492b946ccf7f5343e5d98.jpeg

效果如下:

2b4c397db58c5bac1e2d81993cca2b45.jpeg

对比国外相似软件

恰好,国外也有一款擅长写字的 AI 文生图应用 ——Ideogram。这款应用被称为 Midjourney 和 Stable Diffusion 的「劲敌」,由前 Google 工程师创立,硅谷 AI 大神投资,去年 8 月面世,2 月底发布了最新的模型。我们不妨拿它与可图对比一下:

【写中文】

提示词:一只卡通小狗,身上挂着一个木牌,上面写着 “可爱” 两个字。快手可图:

7f09fec83e367bcade24adaca15b5ac4.jpeg

Ideogram:

bd0c9fc618f25d6e49f0e8fa0ab1dde2.jpeg

【写英文】

提示词:一个生日蛋糕,上面插着生日蜡烛,写着 “Happy Birthday”。快手可图:

950fc1201843bc9b10737e2b585b2125.jpeg

Ideogram:

401dfe51a39710c2f3388ce829f6432b.jpeg

【多关键词】

提示词:摄影人像,写真,东方面孔的羊毛卷长发美女,穿着复古的服装,鲜花点缀在头发上面,高级滤镜,复古,蓝色背景。

025c90e2601d272a9ec84c68f9b63c51.jpeg

Ideogram:

6a96b4acb8351d3d2a59644460ca753f.jpeg

经过多次测评,我们发现快手可图和 Ideogram 各有优势。快手可图在中文生成方面确实惊艳,基本告别「鬼画符」,英文也能生成,不过有时会写错字;而 Ideogram 只懂英文,对于中文那是一窍不通。从生成风格来看,Ideogram 提供 18 种风格,用户可任意选择,而快手可图则只能按照提示词中的风格生成。不过,快手可图作为中国人自己的绘图模型,其逼真度更强,尤其是人物特写,Ideogram 毕竟是外国产品,生成的东方女子要么有外国人的影子,要么不咋好看。此外,二者的生成速度相差不大,10 多秒就能出图。快手可图可调整每次生成图片数量,最多不超过 9 张,Ideogram 每次固定可生成 4 张。最关键的一点是,目前快手可图仍是免费使用,而 Ideogram 每日只有十次免费生成机会。

小结

这段时间,快手重押 AI,狠砸真金白银,埋头搞大模型和 AI 应用。

先是对标 Sora 的 AI 视频生成应用可灵一战成名,接着 AI 生图模型可图备受好评,此外,还有 AI 剪辑应用快剪、AI 特效创作产品必扬、AI 社交应用快崽以及嵌在快手短视频 APP 里的 AI 玩评功能等。

而不管是可灵还是可图,两者均结合了人工智能与艺术创作,为设计师、艺术家、内容创作者以及普通用户提供了一个创新的创作工具,它为用户提供了多样化的创作选择和高质量的作品输出能力。在未来的发展中,快手可图有望成为AI艺术创作领域的重要力量之一。

高性价比GPU算力:

 https://www.ucloud.cn/site/active/gpu.html?ytag=gpu_wenzhang_0716_shemei

  • 14
    点赞
  • 14
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值