鲁班,视觉生成引擎的应用

本文探讨了视觉生成的现状,阐述了智能设计的框架和流程,并通过鲁班这一视觉生成引擎展示了应用案例,揭示了行业的未来发展趋势。
摘要由CSDN通过智能技术生成

云栖君导读:本文介绍了视觉生成的现状,智能设计的框架和流程、应用案例及未来前景。通过本文的学习,可以对视觉生成有基础性的认识,了解行业的现状以及未来的发展趋势。


演讲嘉宾简介:


谢宣松(星瞳),阿里巴巴机器智能技术实验室资深算法专家,专注于视觉生成、智能医疗、图像搜索、信息抽取等方面技术研发和落地;阿里巴巴智能设计(鲁班)的创始成员和技术负责人,医疗影像智能诊断方向负责人,图像搜索拍立淘的早期创始成员。


本次直播视频精彩回顾地址:http://click.aliyun.com/m/46060/


本节课代码及讲义下载地址:http://click.aliyun.com/m/46066/ 或点击左下角阅读原文进入下载!


本次分享主要分为以下几个部分:


  • 定义、目标和愿景

  • 设计行业现状

  • 使用场景

  • 技术框架和生产流程

  • 关键算法

  • 业务进展

  • 案例展示

  • 鹿班

  • 前景展望


一、定义、目标和愿景


视觉生成的定义:可控视觉内容设计和生成,聚焦满足用户、场景需求的数字视觉内容制造,包括针对图像、视频及图形的增强、编辑、渲染、生成、评估等视觉内容设计与制作。用技术赋能和改革设计、广告及数娱行业。


目标:可控视觉内容设计和生成,让AI做设计,使数字内容制造变得高质、高效、普惠、低成本;


愿景:所想,即所见。



视觉生成主要分成三个方向。第一,针对非结构化的图像,如图像。第二,针对结构化的图形。第三,针对视频。



二、设计行业现状


视觉生成较年轻。起初,基本都是通过人工方式完成。小到海报或毕业设计封面的设计这样的小需求,大到阿里巴巴中海量商家的投放渠道及效果这样的大型需求都与其相关。从业人员数量庞大,市场与广告、商家关系紧密,市场容量非常大。


从技术上说,近几年,大家常提到供给侧改革,以前的供给侧基本都是通过人或工具来形成图像、视频等,但这样有很大的局限性,包括:


  • 效率低成本高

  • 数据利用率低,比如去年双十一和今年双十一由于主题不同,需要全盘重做。

  • 无法在线化,从提出需求到得到结果无法做到实时。

  • 难以上下文相关,设计师不会结合用户的个性化需求,形成与上下文相关的结果。


而在消费端,对个性化、精准度、实时性有很高的需求。因此,在供给和需求之间还存在差距。在AI行业中,IN的多:识别、理解、搜索。OUT的少:生成、融合还限于学术圈,系统性落地工程、可商用的产品没有。


因此,“The best way to predict is to create”。



三、使用场景


视觉生成引擎的使用场景大致可抽象成下图。以显式输入而言,用户可以输入标签需要的风格、色彩、构图等,或者输入一个例子,或者进行一些交互的输入。除显式输入之外还可以有隐式输入,比如人群信息、场景信息、上下文信息等。总的来说,输入可以是千变万化的,但通过规范化之后就会减少变化。


  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值