LiveVideoStack人物专访:深耕多媒体二十载,他怎么看未来的视频云?

本文是对阿里云视频云负责人何亚明的访谈。他认为音视频技术呈螺旋式发展,当下大模型与AI为视频云带来新机遇和挑战。阿里云视频云正探索大模型与视频处理结合,提升决策效率,还在抠图、数字人等方面有落地成果。同时,出海也是行业发展方向。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

抓住已知的,迎面未知的。

编者按: 大模型、降本、出海,是多媒体从业者交流的高频词,内容与交互的需求层出不穷,大模型与AI的演进目不暇接,让增速低走的视频云迎面新的机遇和挑战。作为一个跨越中美多媒体行业20年的亲历者(阿里云视频云负责人何亚明),与他的对话展现出一番场景,他没有否认多媒体生态当下的问题,但他说新的机会就在眼前,更重要的是,他对多媒体满怀希望。

策划 撰写 / LiveVideoStack、IMMENSE

在这里插入图片描述

从微软、Facebook到阿里云,何亚明跨越了中美两大最活跃的经济体,走过PC互联网、移动互联网到视频化的20多年,一直与多媒体为伴。

他认为,无论技术和产品如何演进,音视频作为最贴近用户的展示方式大概率不会改变,这是他对多媒体生态依然充满信心的原因之一。不过,随着大模型向AGI不断演进直至实现,多媒体从业者需要将AGI融入到多媒体技术中,甚至改变原本的工作流。比如在微软,Azure media service“退役”了,但团队并没有流失,而是进入到Copilot ,让Copilot与多媒体更好地结合。

在阿里云视频云,何亚明和团队正在探索通过大模型提高视频处理和生产的效率,希望构建一个属于视频的大模型,通过这个系统可以极大地提升业务决策效率,让系统也变得更加的简单。

在他看来,智能时代也是人机交互的新时代,将带来交互方式的变化,这也带来了对视频技术的新需求。 新需求主要体现在算力和时延两个方面。算力方面,视频技术会更多和AI相结合,会消耗更多的算力。算力也会从服务端逐步向移动端扩展,视频处理和生产会变得更高效、更智能。时延方面,随着Vision Pro、Quest 3和Meta Smart Glasses上市,对延时的要求会变得更高,为了用户体验可能会诞生新的传输格式、压缩算法来进一步降低时延。即便死守着多媒体技术老本行,依然有许多工作要做。这是信心的第二个来源。

第三,何亚明认为AIGC会开始逐步商业化落地。 比如目前传统的服务行业(需要和人沟通的场景,需要24小时在线的)对数字人就有很大的需求。 数字人被许多业内同行认为是当下为数不多的增量市场,也是多媒体技术与大模型结合非常成功的场景。包括电商直播、医疗咨询、保险客服等都有非常明确的客户需求和业务落地。

谈到出海,他觉得国内公司积攒了很多能力,而海外的技术服务相对更标准化,更纯粹地比拼技术能力,中国厂商能够吃到非常多的红利。 尤其在社交、电商场景的应用创新,在海外给用户的体验依然是颠覆性的。

最后,何亚明希望 (多媒体企业出海)能像电动车那样,到海外有真正的定价权,因为我们拥有处于领导地位的质量和技术。他坦言,我们的行业需要更多的协同和规范,从纯粹的竞争到取得行业共识,需要大家共同去努力。

总之,无论国内海外,面对多媒体的未来,一切都很难预测,但就像何亚明说的,有时候科技的发展就像一辆高速驶来的列车,你远远地看着,疑惑怎么还不到?但当它真的从你旁边经过时,可能一不小心就过去了。

在这里插入图片描述
以下是何亚明的对话实录:

二十年,一场多媒体的缘分与螺旋

Q1

LiveVideoStack:我记得应该是2018年,亚明老师回国。我印象特别深刻。我接到了一封邮件,然后我一看,这个人好厉害:之前在Facebook、微软,目前在阿里巴巴,我当时在想,我们有这么大吸引力吗?当时特别欣喜,后来顺理成章地邀请亚明过来做2018 年LiveVideoStackCon北京的分享,后续也有陆陆续续的交流,现在想起来还有点梦幻。

我想从两个视角提问。

首先是全球的视角,你的(工作)经历基本上在流媒体这个圈子里,差不多20多年了,是行业的前辈。第二,从国内的视角看,你回国这几年正好赶上流媒体爆发式的增长,从千播大战、教育、社交、游戏等,包括疫情所带来的远程办公需求的暴增,但现在(生态)又进入到一个调整阶段,国内互联网的流量在下降,用户在逐步回归到混合或传统的线下交流,同时大环境又受到整个经济周期的影响。如果将这两个视角结合在一起,你怎么来回顾总结自己20多年与流媒体相爱相伴,简单地说说你的感受。

何亚明 : 这让我回到了2018年的时候跟你第一次接触的场景,我觉得在中国有一个LVS这样一直在音视频圈子里做交流的组织者还是非常感谢的,也非常感谢你的坚持,我们只是在不同的战线都在坚持着。

言归正传,我最早踏入音视频圈子是2000年,那个时候刚刚去微软,这是视频(应用)的第一波爆发

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值