进击的短视频 异构计算驱动AI落地

短视频,在过去两年里成为了耳熟能详的国民应用,堪称互联网行业的“现象级”爆款产品。而今短视频市场人口红利期已经基本消失,强流量和补贴的加入也难以为继,短视频应用究竟该怎样做才能再次实现爆发式的增长呢?

AI能力的“软”升级

AI技术的实现将为短视频行业带来新的发展机遇。短视频涉及一系列的大数据运算与筛选,包含海量原创内容的审核与排查,广大用户画像的刻写与推荐,都需要深度学习算法的实现与优化。另一方面,AI将扮演更重要角色,其延伸能力将有更多生长空间,例如在视频内容理解和原创保护方面将具备更多主动性。

AI能做的事情还有很多,就算法推荐而言,AI会更深度地参与以后的短视频生产、审核、分发全链条。视频理解技术走上舞台,自主渗透理解视频内容,精准实现视频自动分类和有效推动原创保护工作开展。将来视频语义识别能力达到一定高度后,AI还可以像理解文字一样理解视频,将进一步提高视频检索分发效率。同时,AI能力与短视频创作也相得益彰,以AI剪辑为例,通过智能卡点配乐,降低创作者的学习成本和创作门槛,将收获更多用户的青睐。

FPGA芯片的“硬”提升

短视频是一个典型的技术驱动型的行业,而AI技术则是其中最为重要的环节。人工智能需要大量的样本进行训练,但随着人工智能的应用越来越广,训练数据的样本量越来越大,对并行存储容量和带宽都提出了新的要求。

传统处理器面向海量的待处理数据,必然在成本、功耗以及散热等方面迎来更多的挑战。而解决这一问题途径就是硬件采用特定域的架构(Domain Specific Architecture),即异构计算。目前,异构计算包括GPU、FPGA和ASIC三种方式,其中FPGA因低功耗、低延迟、高性能、可编程等特点,已经成为线上推理平台的重要选项。

相对而言,尽管GPU在线下的训练领域取得了很大的成功,但它不太擅长实时推理的应用场景,而FPGA还有一个独特的优势,配备的网卡口使它能够在通信领域发挥更多的价值,因此FPGA将在异构计算时代大有所为。

英特尔的平台搭建

英特尔基于PAC A10、E3S10和PAC S10板卡, 已经构建出了三大类型的异构计算平台。其中,基于英特尔® PAC A10的峰值算力可以达到1.366TFLOPS,构成了片上的分布式存储,可以提供6MB的SRAM。更关键的是,区别于传统处理器,它的片上的SRAM采用分布式的方式,可以提供最高达8TB/s的并行带宽。而PAC S10算力更强,存储的容量更大,资源更丰富,这些板卡可以非常高效的满足深度学习模型的需求。

此外,英特尔® E3S10是一个更大的加速卡,这个大加速卡上面是E3的传统处理器,视频编解码能力非常强,同时还有专门的显示芯片,然后再加上S10的FPGA,就构成了一个比较齐全的异构加速卡,集合了传统处理器和FPGA,可以很好的实现视频和AI的应用结合。

另一方面,为解决传统的FPGA开发周期长的问题,英特尔推出了基于OpenCL语言的开发方式,更好的降低了开发难度,方便硬件技术人员的高效工作。

总体而言,英特尔®FPGA提供的可定制化的开发能力,为短视频在人工智能领域的应用带来新的可能性,同时也进一步助推了短视频在AI领域的探索和创新。

原文链接:https://www.fpga-china.com/7340.html

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值