PixelAI : 手淘客户端上的实时视觉算法应用

本文介绍了手淘客户端上的实时视觉算法库PixelAI,探讨了其设计原则、基础算法和上层应用。算法团队通过模型设计与压缩、多任务学习和小样本学习应对资源限制,实现包括人形分割、人体姿态估计等功能,服务于视频业务的实时交互视觉特效。
摘要由CSDN通过智能技术生成


640?wx_fmt=jpeg


基于PixelAI上层视频业务可以快速搭建符合自身业务特色的实时交互视觉特效。在LiveVideoStackCon2019上海大会中,淘宝高级算法专家李晓波详细介绍了手淘在实现客户端上基于深度学习的视觉算法应用时如何在资源受限的情况下达到性能与效果之间的平衡。


文 / 李晓波

整理 / LiveVideoStack


大家好,我是李晓波(篱悠),目前在淘宝任职高级算法专家。本次分享将从设计原则与整体架构、基础算法和上层应用三个部分来介绍手淘视频业务在客户端上实时视觉算法领域的探索。

 

640?wx_fmt=png


1. 设计原则与整体架构

1.1 手淘多媒体算法整体链路


640?wx_fmt=png


手淘多媒体算法分为视频生产和用户消费两部分,上图左半部环更多是由广告和搜索团队进行收集,算法团队主要负责右半部环中视频智能生产、内容感知及内容理解部分,当算法能够解决高级语义理解和结构化信息时,就可以结合左半部环内容结合起来做视频的个性化分发。

 

1.2 手淘多媒体算法面临的挑战

 

640?wx_fmt=png

 

手淘多媒体算法目前面临业务、技术和业界进展变化(环境)三方面的挑战,应对这些挑战手淘分别在效率、体验和成本三个方面做出控制和改变。


1.3 手淘客户端上实时视觉算法库


1.3.1 模型设计与压缩

 

640?wx_fmt=png

 

在端上做算法面临计算资源和内存受限的问题,移动端上存在很多实时交互的操作,例如视频的帧率一般都是25FPS,如果算法对视频处理的速度很慢,那么用户实时交互的体验就无法得到保障。近几年深度学习在服务器上取得了很大的进展,但是由于计算资源和内存受限导致性能上存在差距,无法照搬深度学习的模型来解决移动端遇到的问题。

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值