大家好,我是程序员晓晓。
一直以来,AI绘画对于字体的绘制还是相当困难的。在Stable Diffusion Web1.5版本的时候,几乎无法正常绘出字体。
在SDXL1.0时代,可以开始识别单词和数字了。
后来很多AI绘画软件都支持了文字生成功能,不过对于汉字,一直没有一款支持汉字的 AI 绘画软件出现。
近日,阿里达摩院发布了一种新颖的文字生成方法AnyText,通过创新性的算法设计,解决中文这种字形繁杂、字符数以万计的文字生成。我们终于可以愉快的生成带有汉字的图片了。
一. AnyText模型介绍
AnyText多语言文字生成与编辑,通过创新性的算法设计,可以支持中文、英语、日语、韩语等多语言的文字生成,还支持对输入图片中的文字内容进行编辑。
我们再来欣赏一下官网展示的画廊。
代码:https://github.com/tyxsspa/AnyText
论文:https://arxiv.org/abs/2311.03054
模型介绍:https://modelscope.cn/models/damo/cv_anytext_text_generation_editing/summary
二. AnyText使用介绍
我们通过在线体验地址进入,总体界面效果与功能如下。
在Run(运行)按钮的下方,也提供了样例模块。可以直接点击,相关样例的生成数据就会同步到图片生成的相关区域,非常便于大家直接体验。
下面对各个模块的功能做一个简要说明。
(1)Instructions(说明): 提供了中文和英文版的操作使用说明。
(2)Parameters(参数):提供了一些绘图的相关参数设置
-
Image Count(图片数):每次生成图片的张数,默认值 4 张。
-
Steps(步数):采样迭代步数,一般来说采样迭代步数越高,生成的图片质量就越高,对应需要的生成时间就更长。
-
Image Width(宽度):生成的图片宽度
-
Image Height(高度):生成的图片高度
-
Strength(控制力度):用于控制提示词和文字生成的精度,取值范围为0-2。
一般来说控制力度越高,生成的图片和字体的准确性越高。
-
CFG-Scale(CFG-强度):提示词引导因子,主要用于和提示词的匹配强度,这里我们直接使用默认值即可。
-
Seed(种子数):生成图片的随机种子,一张图片对应一个唯一值,相当于图片的唯一编号。
-
eta(DDIM):不太清楚具体含义,我们这里使用默认值0即可。
-
Added Prompt(附加提示词):默认一些用于提高画面质量的正向提示词。
-
Negative Prompt(负向提示词):默认一些通用的反向提示词。
(3)Prompt(提示词) :提示词区域,用于编写我们想要生成画面的描述。支持中文和英文。
(4)Text Generation(文字生成)
Pos-Method(位置方式): 支持3种
-
手绘:使用画笔工具涂抹一片区域,生成图片时该区域就对应文字的生成。
-
拖框:通过勾选上面的0-7个数字,勾选了几个就会出来几个正方形的拖框,这个拖框可以移动,也可以上下左右拉伸,跨过多个正方形单元格。
-
随机:图片中文本位置随机生成,比如我们有三段文字需要生成,就会随机放置在三个位置。
Sort Position(位置排序): 用于控制位置排序时的优先级,分为横排和竖排2种选择。
三. AnyText使用体验
提示词:一个漂亮的蜡笔画,有行星,宇航员,还有宇宙飞船,上面写的是"去火星旅行", “小梁子”, “11月1日”。
位置设置使用手绘
位置设置使用托框
位置设置使用随机
提示词:一个装饰华丽的蛋糕,上面用奶油写着“小梁子”和"Willard"
提示词:一个精致的紫砂壶,上面雕刻着一首中国古诗,内容是 “更上一层楼” “欲穷千里目” “黄河入海流” “白日依山尽”
四. AnyText注意事项
你需要在图片中几处生成文本,在位置设置时就需要绘制对应数量的位置,不然会报如下错误。
对于Stable Diffusion爱好者来说,目前还没有Web UI的插件支持,另外,支持的模型也比较少,不过让我们保持关注和期待吧。
写在最后
感兴趣的小伙伴,赠送全套AIGC学习资料,包含AI绘画、AI人工智能等前沿科技教程和软件工具,具体看这里。
AIGC技术的未来发展前景广阔,随着人工智能技术的不断发展,AIGC技术也将不断提高。未来,AIGC技术将在游戏和计算领域得到更广泛的应用,使游戏和计算系统具有更高效、更智能、更灵活的特性。同时,AIGC技术也将与人工智能技术紧密结合,在更多的领域得到广泛应用,对程序员来说影响至关重要。未来,AIGC技术将继续得到提高,同时也将与人工智能技术紧密结合,在更多的领域得到广泛应用。
一、AIGC所有方向的学习路线
AIGC所有方向的技术点做的整理,形成各个领域的知识点汇总,它的用处就在于,你可以按照下面的知识点去找对应的学习资源,保证自己学得较为全面。
二、AIGC必备工具
工具都帮大家整理好了,安装就可直接上手!
三、最新AIGC学习笔记
当我学到一定基础,有自己的理解能力的时候,会去阅读一些前辈整理的书籍或者手写的笔记资料,这些笔记详细记载了他们对一些技术点的理解,这些理解是比较独到,可以学到不一样的思路。
四、AIGC视频教程合集
观看全面零基础学习视频,看视频学习是最快捷也是最有效果的方式,跟着视频中老师的思路,从基础到深入,还是很容易入门的。
五、实战案例
纸上得来终觉浅,要学会跟着视频一起敲,要动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。
