在无数AI绘画创作者的胡呼声中,Midjourney终于推出了“角色一致性”功能,该功能可在新图像中一致地重新创建角色。AI绘画中的主要障碍终被打破。
这是因为大多数AI图像生成器都依赖于“扩散模型”,这些工具类似于或基于Stability AI的Stable Diffusion开源图像生成算法,该算法的工作原理大致是获取用户输入的文本并尝试逐像素拼凑图像。-与该描述相匹配的像素,是从数百万张人类创建的图像的大量(且有争议的)训练数据集中的类似图像和文本标签中学习到的。
添加图片注释,不超过 140 字(可选)
角色一致性对于AI绘画的意义
与基于文本的大型语言模型(LLM)(例如OpenAI的ChatGPT或Cohere的新Command-R)的情况一样,所有生成式AI应用程序的问题在于其响应不一致:AI会为每个提示生成新的内容即使提示重复或使用一些相同的关键字,也应输入该内容。
在Midjourney 的例子中,就是图像。但是,如果你想为电影、小说或漫画制作故事时,你希望相同的一个或多个角色在其中移动并出现在不同的场景中,并具有不同的面部表情和表情,这在Midjourney 以往的版本中是无法实现的。
这种确切的场景对于叙事的连续性通常是必要的,但到目前为止,使用生成式人工智能很难实现。但Midjourney现在正在尝试解决这个问题,引入了一个新标签“-cref”(“角色参考”的缩写),用户可以