(一)分割抠图解题思路 如下图所示,分割抠图包括不同的层次,从语义分割到实例分割再到 Image Matting。 整体来说分割抠图的过程是比较复杂的,总的来说我们的思路是先拆解再丰富数 据样本,其框架如下图所示。 视觉生产技术探索和应用
(二)分割抠图效果展示 如下图所示,通过上面的技术我们在发丝级的分割和镂空细节特殊场景等例子中 取得了较好的效果。目前,在阿里巴巴内部分割抠图技术是使用最广的视觉 AI 技术。 基于分割抠图技术,我们可以对分割进行拓展,进行多式多样的分割,比如对人 的分割,可以从图像中分割出人的头像、单独分割出头发、单独分割出人脸等,更进 一步,除了静态图像的分割,我们甚至对视频进行分割,在动态的视频中提取人物。 类似的,对于动物分割、车辆分割、商品分割、动画分割等,我们也可以进行相应的 拓展,来丰富我们的分割粒度。另外的,对于场景抠图,比如天空分割,我们把天空 分割出来的同时把人物、物体等分割出来,进行场景分割的拓展。 三、视觉生成——从无到有 在完成分割之后,我们对视觉有了精细的理解,才能够进行下一步的工作。
(一)视觉生成——鹿班 最早的时候我们做了产品鹿班。鹿班是视觉生成领域在业界落地的先行者,对外 视觉生产技术探索和应用 提供大规模在线的 AI 设计服务。它是针对平面图像设计生成的产品,一开始在阿里 巴巴内部大规模使用,目前已经通过阿里巴巴的云服务对外提供服务。鹿班的视觉生 成的框架流程如下图所示,其大概过程包括理需求、定草图、选状态、调细节、生成 图、评好坏 6 个步骤。 鹿班在多个领域有着广泛的应用,一开始是在电商领域,主要有以下两个能力: ● 照图生图:参考原图,将风格、布局等信息学习并迁移到目标数据上; ● 个性化设计:多元化设计风格,结合商品品类、投放场景、目标客群的差异进 行定制化设计。 如下图所示,鹿班还可以用来做场景智能美工,用 AI 实现场景设计能力,大大 降低人力成本。 视觉生产技术探索和应用 当然,鹿班的应用不仅是以上几个行业
三、视觉生成——从无到有 在完成分割之后,我们对视觉有了精细的理解,才能够进行下一步的工作。
(一)视觉生成——鹿班 最早的时候我们做了产品鹿班。鹿班是视觉生成领域在业界落地的先行者,对外 视觉生产技术探索和应用 提供大规模在线的 AI 设计服务。它是针对平面图像设计生成的产品,一开始在阿里 巴巴内部大规模使用,目前已经通过阿里巴巴的云服务对外提供服务。鹿班的视觉生 成的框架流程如下图所示,其大概过程包括理需求、定草图、选状态、调细节、生成 图、评好坏 6 个步骤。 鹿班在多个领域有着广泛的应用,一开始是在电商领域,主要有以下两个能力: ● 照图生图:参考原图,将风格、布局等信息学习并迁移到目标数据上; ● 个性化设计:多元化设计风格,结合商品品类、投放场景、目标客群的差异进 行定制化设计。 如下图所示,鹿班还可以用来做场景智能美工,用 AI 实现场景设计能力,大大 降低人力成本。 视觉生产技术探索和应用 当然,鹿班的应用不仅是以上几个行业,它在各行各业都有着广泛的应用,并且 在各个行业的应用都会产生不同的效果,依据场景来进行赋能。
(二)视觉生成——AlibabWood 鹿班主要针对的是平面图生成,但是实际上更多场景需要的是视频生成,比如 当前流行的短视频,对此阿里巴巴也设计了 AlibabWood 这款产品,专注于短视频 的生成,目前已经累计生成了超过 2000 万个短视频,同时还有剧本生成、智能文 案生成、自动剪辑、智能音乐推荐等实用功能。AlibabWood 的框架流程如下图所 示,总体包括素材准备、基础特效、智能特效和智能编排四大步骤,包括了众多技 术在内。
视觉生产技术探索和应用 AlibabWood 有着众多应用案例,比如场景化智能视频的生成,还可以规模化生 成特效视频,当然,如下图所示,在生成了视频之后,如果有多个视频,还可以进行 视频摘要的生成以及考虑旁白完整性的智能视频集锦。 视频封面的生成也是一个重要的应用,如下图所示,它可以对视频内容全自动完 成质量审核、内容分析与图像增强,输出多帧静止或者动图,这个过程用到了图像增 视觉生产技术探索和应用强、内容分析等技术,也是在视频生成之后一个非常重要的技术应用。
阿里云高校计划,陪伴两千多所高校在校生云上实践、云上成长。在这里你可以领用免费的cpu资源,还可以参加免费训练营,实践提高:https://developer.aliyun.com/adc/student/