AnyText:阿里新突破,准确写汉字的AI绘画工具来了

大家好,我是程序员晓晓。

一直以来,AI绘画对于字体的绘制还是相当困难的。在Stable Diffusion Web1.5版本的时候,几乎无法正常绘出字体。

在SDXL1.0时代,可以开始识别单词和数字了。

后来很多AI绘画软件都支持了文字生成功能,不过对于汉字,一直没有一款支持汉字的 AI 绘画软件出现。

近日,阿里达摩院发布了一种新颖的文字生成方法AnyText,通过创新性的算法设计,解决中文这种字形繁杂、字符数以万计的文字生成。我们终于可以愉快的生成带有汉字的图片了。

一. AnyText模型介绍

AnyText多语言文字生成与编辑,通过创新性的算法设计,可以支持中文、英语、日语、韩语等多语言的文字生成,还支持对输入图片中的文字内容进行编辑。

我们再来欣赏一下官网展示的画廊。

代码:https://github.com/tyxsspa/AnyText

论文:https://arxiv.org/abs/2311.03054

模型介绍:https://modelscope.cn/models/damo/cv_anytext_text_generation_editing/summary

二. AnyText使用介绍

我们通过在线体验地址进入,总体界面效果与功能如下。

在Run(运行)按钮的下方,也提供了样例模块。可以直接点击,相关样例的生成数据就会同步到图片生成的相关区域,非常便于大家直接体验。

下面对各个模块的功能做一个简要说明。

(1)Instructions(说明): 提供了中文和英文版的操作使用说明。

(2)Parameters(参数):提供了一些绘图的相关参数设置

  • Image Count(图片数):每次生成图片的张数,默认值 4 张。

  • Steps(步数):采样迭代步数,一般来说采样迭代步数越高,生成的图片质量就越高,对应需要的生成时间就更长。

  • Image Width(宽度):生成的图片宽度

  • Image Height(高度):生成的图片高度

  • Strength(控制力度):用于控制提示词和文字生成的精度,取值范围为0-2。

    一般来说控制力度越高,生成的图片和字体的准确性越高。

  • CFG-Scale(CFG-强度):提示词引导因子,主要用于和提示词的匹配强度,这里我们直接使用默认值即可。

  • Seed(种子数):生成图片的随机种子,一张图片对应一个唯一值,相当于图片的唯一编号。

  • eta(DDIM):不太清楚具体含义,我们这里使用默认值0即可。

  • Added Prompt(附加提示词):默认一些用于提高画面质量的正向提示词。

  • Negative Prompt(负向提示词):默认一些通用的反向提示词。

(3)Prompt(提示词) :提示词区域,用于编写我们想要生成画面的描述。支持中文和英文。

(4)Text Generation(文字生成)

Pos-Method(位置方式): 支持3种

  • 手绘:使用画笔工具涂抹一片区域,生成图片时该区域就对应文字的生成。

  • 拖框:通过勾选上面的0-7个数字,勾选了几个就会出来几个正方形的拖框,这个拖框可以移动,也可以上下左右拉伸,跨过多个正方形单元格。

  • 随机:图片中文本位置随机生成,比如我们有三段文字需要生成,就会随机放置在三个位置。

Sort Position(位置排序): 用于控制位置排序时的优先级,分为横排和竖排2种选择。

三. AnyText使用体验

提示词:一个漂亮的蜡笔画,有行星,宇航员,还有宇宙飞船,上面写的是"去火星旅行", “小梁子”, “11月1日”。

位置设置使用手绘

位置设置使用托框

位置设置使用随机

提示词:一个装饰华丽的蛋糕,上面用奶油写着“小梁子”和"Willard"

提示词:一个精致的紫砂壶,上面雕刻着一首中国古诗,内容是 “更上一层楼” “欲穷千里目” “黄河入海流” “白日依山尽”

四. AnyText注意事项

你需要在图片中几处生成文本,在位置设置时就需要绘制对应数量的位置,不然会报如下错误。

对于Stable Diffusion爱好者来说,目前还没有Web UI的插件支持,另外,支持的模型也比较少,不过让我们保持关注和期待吧。

写在最后

感兴趣的小伙伴,赠送全套AIGC学习资料,包含AI绘画、AI人工智能等前沿科技教程和软件工具,具体看这里。

AIGC技术的未来发展前景广阔,随着人工智能技术的不断发展,AIGC技术也将不断提高。未来,AIGC技术将在游戏和计算领域得到更广泛的应用,使游戏和计算系统具有更高效、更智能、更灵活的特性。同时,AIGC技术也将与人工智能技术紧密结合,在更多的领域得到广泛应用,对程序员来说影响至关重要。未来,AIGC技术将继续得到提高,同时也将与人工智能技术紧密结合,在更多的领域得到广泛应用。

在这里插入图片描述

一、AIGC所有方向的学习路线

AIGC所有方向的技术点做的整理,形成各个领域的知识点汇总,它的用处就在于,你可以按照下面的知识点去找对应的学习资源,保证自己学得较为全面。

在这里插入图片描述

在这里插入图片描述

二、AIGC必备工具

工具都帮大家整理好了,安装就可直接上手!
在这里插入图片描述

三、最新AIGC学习笔记

当我学到一定基础,有自己的理解能力的时候,会去阅读一些前辈整理的书籍或者手写的笔记资料,这些笔记详细记载了他们对一些技术点的理解,这些理解是比较独到,可以学到不一样的思路。
在这里插入图片描述
在这里插入图片描述

四、AIGC视频教程合集

观看全面零基础学习视频,看视频学习是最快捷也是最有效果的方式,跟着视频中老师的思路,从基础到深入,还是很容易入门的。

在这里插入图片描述

五、实战案例

纸上得来终觉浅,要学会跟着视频一起敲,要动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。
在这里插入图片描述

若有侵权,请联系删除
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值