大模型——CogView4:生成中英双语高清图片的开源文生图模型综合介绍

CogView4:生成中英双语高清图片的开源文生图模型综合介绍

CogView4 是由清华大学 KEG 实验室(THUDM)开发的一款开源文生图模型,专注于将文本描述转化为高质量图像。它支持中英双语提示词输入,尤其擅长理解中文提示并生成带有汉字的图像,非常适合广告设计、短视频创作等场景。作为首个支持在画面中生成汉字的开源模型,CogView4 在复杂语义对齐和指令跟随能力上表现出色。它基于 GLM-4-9B 文本编码器,支持任意长度的提示词输入,并能生成高达 2048 分辨率的图像。项目托管在 GitHub 上,提供详细代码和使用文档,吸引了大量开发者与创作者关注与参与。

最新的 CogView4 模型将于3月13日上线 智谱清言 官网。

CogView4:生成中英双语高清图片的开源文生图模型-1

在线体验:https://huggingface.co/spaces/THUDM-HF-SPACE/CogView4

功能列表

  • 中英双语提示词生成图像:支持中文和英文描述,能精准理解并生成符合提示的图
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

不二人生

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值