图像生成类的生成式AI的感性评估-CSDN博客

[编者：看看硅谷在GenAI领域的创新，我们发现有不少有趣的应用，我们请张同学试用了一下排名比较靠前的一些生成式AI，写了一个感性的评估出来，不是很理性的那种。]

Leonardo.Ai：综合：四星

介绍：Leonardo是基于Stable Diffusion的网站，同时深度集成了Stable Diffusion的各种插件，比如ControlNET的openpose姿势参考、局部重绘、prompt提示等等，毫无疑问这是一个很优秀的模型。

它在使用的过程中，允许使用者对需要绘画的图片进行很细节的描写，这无疑是一件很优秀的事情，并且在使用者未能完善的描写所需要绘画的图片的特征时，它也会给出一定的提示。

评价与分析：但是他也同样有着一定的缺点，例如他对于人物手部的描绘依旧不是很完美，这似乎是每一个AI模型都有的缺点。同时，关于特征的选取也并不是很完善，例如我输入一个中国女孩，并且不对女孩的衣服进行要求，它给出的图片必定是身穿旗袍，存在一定的思想限制。

‘

NightCafe Studio：综合：三星

介绍：NightCafe Studio 是一款创意应用程序，它使用 AI 帮助用户将文本提示转换为令人惊叹的图像。用户只需输入提示，软件就会根据该提示生成高分辨率图像。然后，用户可以将这些图像用作艺术品、桌面背景，甚至用于 T 恤或印刷品等商品。 NightCafe Studio 是一款革命性的工具，让任何人都可以轻松创建美丽的图像，而无需任何艺术培训。使用者可以选用四十二种不同的绘画风格，即使是对于同一种提示，绘画出的结果也是不一样的。

评价与分析：当然这个模型并不是十全十美，他的训练结果依旧不完美。例如，当我输入宇航员骑着鲨鱼穿越星空这种比较抽象的描述时，它给出的结果并不准确。

Playground Al：综合：两点五星

介绍：Playground AI 是一个平台，允许用户使用用户友好的网络界面来生成用户想要的图片。借助 Playground AI，用户可以选择多种多样的模型例如stable diffusion，DALL-E2, Playground来生成图片。除了直接利用文章的提示生成图像之外，Playground AI 的“图像到图像”功能也是一个突出的组件。使用者可以在图像的蒙版区域上进行绘制，以根据喜欢的更改进行更改，例如使得画面中的任务手臂变得更加粗壮或者使得他的牙齿更加洁白。

评价与分析：当然，他也有一定的缺陷。例如，并不支持中文。当我输入宇航员骑着鲨鱼穿越星空时，给出的图片是

而我切换成英文时，结果时这样的：

Photosonic：综合：三星

介绍：PhotoSonic利用尖端的人工智能算法将文本转换为图片。首先，用户在 PhotoSonic 界面中输入所需的文本。然后，人工智能模型对文本进行分析，以提取文字主题、情感。借助 PhotoSonic，使用者可以快速获得他们所需要的图片，无需复杂的软件或技术专业知识。只需输入想要生成照片的提示，然后让人工智能处理剩下的事情。对于那些希望只需点击几下即可改善照片外观的人来说，PhotoSonic 是一款出色的工具。

评价与分析：同时，这个模型我认为最主要的问题是它的准确度。当我输入宇航员时，他给予的图片并不仅仅只是一个宇航员，同时他会给我生成一些关于宇宙或者某一个行星的照片。

与此同时，当我输入宇航员，骑着鲨鱼在行星中遨游时，他给予的图片似乎和主题没有关系，可能他并不能理解很复杂的话语。

Liblib：综合：四星

介绍：这是一个用于人工智能生成图片的平台，它主要的作用是通过人们输入的提示从而生成相对应的图片。首先，人们需要向网站中输入图片的提示，之后选择想要使用的模型例如stable diffusion，再经过对参数例如图片大小或者图片分辨率的选取之后，就可以得到想要生成的图片。

评价与分析：这个网页的设计我认为确实十分的优秀。首先，它允许使用者设定CLIP跳过层或者随机数种子甚至iteration次数，这种十分专业的参数，已经可以满足一些学者对模型最基础的测试。其次，它允许输入自己设计或者别人设计的模型，这让一些模型的测试也更加的便利。不仅如此，它还允许使用者使用不同的生成模型例如stable diffusion，或者DALL-E，这是一个很类似于civita的网站，但是它同样支持中文。

这个网站的问题也很明显。网站给予的默认模型中很多并不是最新的模型，例如在一些网站都已经开始使用stable diffusion V2的时候，它仍然在使用stable diffusion V1.这无疑导致图片生成的质量并不高。当然，你也可以使用站内一些由学者自己设计的模型，这给予了很高的自由度。

Imgcreator：综合：四点五星

介绍：ImgCreator是一个使用机器学习根据文本提示创建逼真图像的平台。它利用人工智能，根据文本提示，组合数百万张真实图像，生成新图像。 ImgCreator 允许用户自定义他们的输入，以生成符合他们所需审美的图像。该平台用户友好，并提供广泛的定制选项来创建完美的形象。 ImgCreator 是设计师、艺术家和内容创作者的强大工具，因为它提供了一种快速有效的方法来生成用于各种目的的高质量图像。与此同时，它也提供风格转移功能，即输入一张图片，通过将别的图片的风格融合，生成新的图片。

风格迁移前：风格迁移后：

评价与分析：我认为这个模型最大的优势在于它允许使用者输入一些负面的提示，即不想要出现在屏幕中的物品特性，这使得图片的生成更加的准确。当然，提供手机版本也是一个无可替代的优势，毕竟相较于一些修图软件，可能这种平台更加的便利。

Sea art AI:综合：五星

介绍：一个堪称全能的图片生成网页，其中的功能几乎涵盖了市面上大部分图像处理的方式，对图像处理的各种运用都有所涉猎，边缘修复，图片修补，背景去除，草图生成，文字到图片生成等等。同时它给予了使用者参数的选取，例如，生成模型的选取（REV，Ghost Mix等等）,负标签，随机种子，采样方法的选取等等。它还允许输入自己设计的模型和数据集和风格，进行测试。从各个角度而言，它都是一个不仅可以提供给一般使用者编辑图片的软件，更是可以用于一些学者作为专业测试使用。

评价与分析：下方是一个我采用的测试案例，可以很清晰的理解它的优点。

提示：

(杰作的:1.3), (最佳电影质量:1.2), (极其详细的设置:1), (软和+艺术灯光), (1男孩), 蓝色短发, (资眼+骚黄+通红的:1.4), (五彩眼睛+异色症), 穿着赛博朋克服装, 未来感的, 科技感的, 城市风光与 (周围的机器人)0.4], 提供戏剧性的风景.

负标签：

斗鸡眼、草图、（最差质量：2）、（低质量：2）、（正常质量：2）、低分辨率、正常质量、（（单色））、（（灰度））、皮肤斑点、痤疮、皮肤瑕疵、不良解剖结构、DeepNegative、背向、倾斜头部、{多人}、低分辨率、不良解剖结构、不良手、文本、错误、手指缺失、多余数字、数字较少、裁剪、最差质量、低质量、正常质量、jpegartifacts , 签名, 水印, 用户名, 模糊, 脚不好, 裁剪, 手画得不好, 脸画得不好, 突变, 变形, 质量最差, 低质量, 正常质量, jpeg 伪影, 签名, 水印, 额外的手指, 数字较少, 额外的肢体，额外的手臂，额外的腿，畸形的四肢，融合的手指，太多的手指，长脖子，斗鸡眼，变异的手，极低分辨率，不良的身体，不良的比例，总的比例，文字，错误，缺失的手指，缺失的手臂，缺失腿，额外的手指，额外的手臂，额外的腿，额外的脚，（（重复的头发））