AI 论文多项目少落地难?阿里造新物种 Aliwood,起了个好头

640?wx_fmt=gif


大家好,我是为人造的智能操碎了心的智能禅师。

关于 AI 项目落地的问题,9 月份云栖大会的时候,禅师其实和阿里 PAI 的负责人林伟提过。

这不马上又要双十一了,禅师掐指一算,淘宝面临大量商家对快速上新、调价、更新商品介绍、制作和上传视频的需求。

此时此刻,素材和速度,就是用户最大的痛点。这个时候靠什么?自然是靠 AI 了。禅师的问题是白问的?

今年双十一,注定将成为一次 AI 落地商用领域的一次非常好的案例。

全文大约1500字。读完可能需要好几首下面这首歌的时间

?

640?wx_fmt=png

9 月份的时候,Reddit 一位网友在实践一篇论文的时候,发现了一个审核人员都没发现的问题,导致无法复现 CVPR18 论文的结果。

虽然后来论文作者花了 3 个星期,找出了症结所在,但也从一个侧面反映了一个问题:理论多于实践。

640?wx_fmt=png

实践只需要挑战自我,落地要替别人解决问题。从实践到落地,中间差了一个产品设计的距离。

要落地一个项目,首先要了解用户痛点的症结所在,然后统筹规划企业可用资源,根据当前生产能力,出一套解决方案,最终帮助用户解决痛点。

论文才看对错,落地只关心成败。

640?wx_fmt=jpeg

落地做 AI

禅师并不常上淘宝,毕竟禅师是一个被粉丝称为钢铁直男的人(关键是,说这话的是男的…)

以前上淘宝进入商品详情页,基本就是商品介绍图片;现在进入商品详情页,首先入眼的是视频。


相比静止的图片,视频可以传递出更多的信息,可以更方便的展示商品细节,可以加入炫酷的视觉效果,从而更有效的激发用户的购买欲望。

数据也很说明问题。阿里巴巴达摩院自然交互体验实验室负责人傅利民说,视频能增加 2.6% 的线上购买量,增加顾客 5% 的次均停留时间。

但随之而来的问题是视频的制作成本非常高,制作周期也远比图片长。镜头走向从上到下还是从左到右?什么时候拉近什么时候推远?一个镜头停留多长时间?

后期的时候还需要对视频里的每一段,一遍遍的进行编辑。留哪段删哪段?速度加快还是放慢?加什么样的动态特效?选择什么样的背景音乐?

640?wx_fmt=jpeg

所以虽然视频对销量的提升很明显,但目前淘宝只有不到 1% 的商品实现了视频化表达。如果要在 1 年内满足这个需求,需要 50 万设计师。

上传到服务器也需要耗费更多的时间。如果碰上网络不稳定,传个视频简直想死。

我们训练人工智能,不就是为了解决数据量过大、人力不足吗?好,接下来就可以把上面的问题概括成几个关键词:

  1. 图像识别

  2. 音频识别

  3. 情感分析

  4. 智能匹配

  5. 自动生成

当我们把这些关键词涉及到的 AI 技术,通过某种方式结合起来,然后打包成一套解决方案,给到用户,就是一次从理论到落地的完整过程。

所以觉得 AI 落地难,有时候可能只是因为思维的方向反了。首先我们要看到实际问题,然后根据问题的突破点,去找对应的 AI 技术。

接下来我们看看阿里是怎么设计整个产品流程的。

HOW TO

视觉素材

首先需要解决的是视频素材。重新拍摄显然不现实,我要重新拍摄,还要 AI 何用?

所以最优的解决方案,是调取商家已存在的商品介绍图片,对图片进行分析识别,打好标签(比如 男装衣领腰带鞋底…)。

640?wx_fmt=png

音乐情感分析

视觉素材有了,接下来就需要添加背景音乐。阿里采用了全域智能技术方案,相关技术与创意来源于浙江大学团队,曾获得中国互联网+大学生创新创业金奖。

首先选取大约 10000 首音乐,将每首歌,按照 3 秒一个音乐片段进行截取,作为学习数据。

按照一首音乐 3 分钟为例,数据集超过 60 万个音乐片段,然后将这些音频转换为频谱图学习。

最后将这些音乐按照风格、节奏、情感,韵律等维度进行归类。

生成视频

结合阿里对商品的购物趋势、视频观看偏好数据,利用视频图片分析、视频分割、短视频知识图谱、短视频自动评估体系、视频和音乐情感分析等算法技术,最终生成更符商家风格、更适合商品表达的视频。

然后将上述解决方案进行打包成一个产品,就完成了一次将 AI 技术从理论到落地的完整过程。

由此,诞生了一个新物种?

Aliwood

说他是新物种,首先够新。今年 4 月份的时候,阿里只是对外披露了有 Alibaba Wood 这么一个东西。今年双十一,就直接用上了。禅师也会密切关注后续 Aliwood 的进展。

640?wx_fmt=jpeg

其次这个产品背后很复杂,涉及到图像识别、视频智能生成和剪辑、打通音乐和情感连接,高速的实时计算能力等等,完全可以撑得起“物种”俩字。

Aliwood 由阿里巴巴人机自然交互实验室联合(阿里云)人工智能中心(Artificial Intelligence Center)和浙江大学 IDEA 实验室基于各自优势领域一次跨学科跨团合作。

640?wx_fmt=jpeg640?wx_fmt=jpeg

人机交互实验室是离设计最近的,最懂设计,一直致力于研究机器和人类五感打通;浙江大学在视频知识图谱、情感计算和音乐分析技术方面都很强。

两者共同打造的产品,成效也非常显著。根据阿里向禅师透露的数据,森马借助 ALibaba Wood 生成的视频,视频制作的成本降低了 90%,效率提升了 95%。

森马利用 Aliwood 自动生成的视频

在商业表现方面,成交转化率提升了 46.9%,加购转化率提升了 36.7%,在一个月内增加效益 70.1 万元。

据接近阿里的线人透露给禅师,目前试点的合作商家有几十个。月底可能会扩大到大部分的商家。没有开通 Aliwood 也不要紧,稍安勿躁!

这不禁让禅师又想起 People.ai 之所以能融 2 亿,靠的其实就是能够为客户提升销量。

开了一个好头

浙江大学国际设计研究院副院长、浙大-阿里 IDEA Lab 负责人孙凌云表示:

设计和 AI 的融合趋势势不可挡,阿里基于在商业场景和领先技术基础不断对于 DesignAI 探索和实践。

可以预期。在不久将来影响到各个传统设计领域,也将不断拓展设计领域边界,创造出更多新设计业态支持新商业发展。

禅师觉得,阿里这次的做法,为 AI 技术的落地,开了一个好头。AI 技术从来不是单兵作战,不是跟现实割裂,并不是像很多人口中像修真小说一样不可思议。

AI 的各个分支,就好像乐高的小积木块一样。只有经过设计,把他们拼起来,才能变成伟大的作品。


640?wx_fmt=png

幸福
无非就是
我  AI  你


640?wx_fmt=gif

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值