自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

LiveVideoStack

分享音视频直播相关技术干货,产品研究与行业趋势。

  • 博客(1915)
  • 收藏
  • 关注

转载 AV夜话#12:从LiveKit聊起

▲扫描图中二维码或点击阅读原文▲LiveVideoStackCon 2023上海正在招募讲师,扫码或阅读原文了解信息上周五,和李一请教了当下多媒体人才市场的现状,整体的情况并不乐观,体现在:大型公司的人才需求锐减,即便放出的岗位要求也很高,很多岗位有5-10个候选人竞争;2023届大学本科应届生数量再创新高,达到1158万;4月份,16-24岁劳动力城镇调查失业率为20.4%,仍然面临上升压力。截...

2023-05-25 13:00:26 3

原创 实时互动下视频 QoE 端到端轻量化网络建模

在实时视频互动中,影响观众对视频体验的有较多且复杂的因素,包括:画质、流畅度以及与其耦合的观看设备等。传统客观算法会利用网络传输或编解码参数拟合接收端人的感知体验,或者使用图像质量结合其他相关参数拟合实时视频质量。由于缺少除画质外的量化指标且没有直接衡量视频感知体验,所以当前QoE算法有一定局限性。目前端到端的QoE模型可以有效解决上述面临的难题,但同时也面临着主观实验复杂、数据依赖与模型运算量大...

2023-05-24 08:00:11 337

原创 媒体传输协议的演进与未来

音视频应用近年来呈现出迅猛的发展趋势,成为互联网流量的主要载体,其玩法丰富,形态多样,众多繁杂的媒体传输协议也应运而生。LiveVideoStackCon 2022北京站邀请到快手传输算法负责人周超,结合快手在媒体传输上的优化与实践,基于快手KTP、KLP、LAS等协议和标准,为我们介绍了媒体传输协议的演进与面临的挑战;还分享了最新的媒体传输标准CMTP,探索未来更多可能。文/周超编辑/LiveV...

2023-05-23 08:00:36 201

原创 海量视频处理的应对和算法实践

随着短视频、直播、智慧城市、5G等的快速发展,视频内容铺天盖地,五花八门,相应的处理需求也多种多样。如何能高效地应对?需要在数据处理系统,底层计算能力,以及算法研究等多方面协同努力。LiveVideoStackCon 2022 北京站邀请到沐曦AI解决方案总监——虞新阳,为大家梳理视频处理的需求及介绍沐曦应对视频处理场景的GPU产品等。文/虞新阳编辑/LiveVideoStack大家好,我是虞新阳...

2023-05-22 08:02:59 297

原创 音视频技术开发周刊 | 294

每周一期,纵览音视频技术领域的干货。新闻投稿:contribute@livevideostack.com。五问「ChatGPT+医学影像」:新一代的 AI 能否成为放射科医生的一把利器?在医学等专业性较强的领域内,ChatGPT的表现还不够好,如果想将ChatGPT应用到医学影像之中,多模态学习必不可少。医学领域中目前存在很多的图像、音频、文本等不同种类的数据,必须利用多模态学习将其进行结合,才能...

2023-05-21 12:01:15 358

原创 云端一体助力体验升级和业务创新

随着音视频和AI技术的发展,在满足用户基础体验和需求情况下,更极致的用户体验和更丰富的互动玩法,成为各个平台打造核心竞争力的关键。LiveVideoStackCon 2022 北京站邀请到火山引擎视频云华南区业务负责人——张培垒,基于节跳动音视频业务实践沉淀,介绍音视频云端一体解决方案如何助力用户体验升级和业务创新。文/张培垒编辑/LiveVideoStack大家好,我是火山引擎视频云商业化方向华...

2023-05-19 08:00:05 424

原创 音频品鉴与歌唱评价——音频内容理解实践

歌唱评价是K歌系统中核心技术之一。近年来,歌唱评价领域也发生着多元化和深度化的变革。本次LiveVideoStackCon 2022 北京站邀请到腾讯音乐天琴实验室高级研究员——江益靓,为大家介绍全民K歌的多维度评价技术和深度歌唱评价技术的实践,以及优质内容挖掘中使用的音频品鉴系统。文/江益靓编辑/LiveVideoStack各位同行朋友们,大家好,很高兴和大家一起分享交流,本次分享的主题是音频品...

2023-05-18 08:00:22 319

转载 #求职者联盟@多媒体技术人才

基于音视频服务和产品使用场景、需求的变化,多媒体行业过去一段时间内经历了飞速发展的阶段,但转过头来看2023年,在爆发增长过后,相关产业正普遍慢下脚步,寻求更多创新突破,发现新一轮的增长机会。对于企业来说,重细节、成本,寻求创新,需要更多高端人才的支撑;对于个人从业者来说,提升技术与能力,寻求更具成长与发展空间的工作和机会无疑是难上加难。最近一段时间,也有一些同学或企业找到我们,希望通过我们来寻找...

2023-05-18 08:00:22 11

原创 要不要和我们一起看看音视频技术未来的模样?

▲扫描图中二维码或点击“阅读原文”▲直通LiveVideoStackCon 2023上海站九折优惠2023年5月11日,Google I/O年度开发者大会完美落幕。随着PaLM2模型发布、Bard的自由访问,技术彻底迎来了“AI 时代”。但今天我们想聊的并不是AI,而是一直支持AI发展的音视频技术。我很喜欢I/O这两个字母的含义:它代表Input与Output(输入与输出),是计算机系统与世界交...

2023-05-17 08:00:34 274

转载 【今晚7点】元宇宙直播的终端架构设计和关键技术

点击上方“LiveVideoStack”关注我们:互娱类直播产品经历过秀场直播、互动直播发展至今,产品形态上逐步见顶,探索新的互动方式成为主流直播平台新的风向标。2021年开始,『元宇宙』凭借其独特的新特征逐步进入直播领域。元宇宙+直播这种全新的融合方式成为时下互娱类直播新的突破口。今晚 7:00,我们邀请到了百度智能云视频云资深研发工程师李明路老师围绕终端引擎技术发展与演进,详细介绍元宇宙直播...

2023-05-16 08:01:31 16

原创 AV夜话11:关于多媒体人才的现状

▲扫描图中二维码或点击阅读原文▲LiveVideoStackCon 2023上海正在招募讲师,扫码或阅读原文了解信息今年3月31日-4月1日北京的LiveVideoStackCon成为参与人数最多的一次,但这并没有证明多媒体生态蒸蒸日上,反而正面临发展减速,不断寻找新的增长点,多媒体生态从业者也面临比较艰难的日子。一名服务于一线科技公司的猎头职员告诉LiveVideoStack:“2023年相对2...

2023-05-15 08:00:14 23

原创 音视频技术开发周刊 | 293

每周一期,纵览音视频技术领域的干货。新闻投稿:contribute@livevideostack.com。谷歌全面反攻 ChatGPT!PaLM 2、Gemini 双杀,Bard 正式开放以上是2023 Google I/O 大会的重点内容,AI含量极高。谷歌推拥有26000个H100的超算,加速AI军备竞赛云提供商正在组建 GPU 大军,以提供更多的 AI 火力。在今天举行的年度 Google ...

2023-05-14 08:03:22 213

原创 快速落地基于“AIGC+数字人”的数字化内容生产

谁不想有一个可爱的数字人形象呢?在日常的工作和娱乐中,越来越多的数字人虚拟形象与大家见面,他们可以是主播,也可以是语音助手,还可以是你自己的虚拟宠物。只有更快更精准的生成数字人,才能让数字人更加普及,普通消费者才能更多地接触到数字人。LiveVideoStackCon 2022北京站邀请到了张瑞全老师为我们分享美摄科技的数字人技术。文/张瑞全编辑/LiveVideoStack大家好,我是来自美摄科...

2023-05-12 08:04:20 418

转载 AV夜话#10 于昕:聊聊GPT与智能问答

▲扫描图中二维码或点击阅读原文▲LiveVideoStackCon 2023上海正在招募讲师,扫码或阅读原文了解信息上周五,与北京理工大学的王晶老师交流了音频技术的机会,我们聊到了许多有趣的话题。比如几年前被寄予厚望的AI音频Codec在工业界落地的情况并不好,原因既有鲁棒性问题,也有现有终端算力问题。还比如音频人才的就业现状,答案是还不错,尤其有高水平的应届生依然很抢手。当然还重点交流了音频技术...

2023-05-12 08:04:20 19

原创 RTC 体验优化的“极值”度量与应用

随着线上互动需求的增加,直播连麦、语音/视频聊天的应用越来越广泛。我们一直在说“追求用户的极致体验”,但是体验是一个抽象的概念,很难量化和统计。如何从用户的行为中得到所在场景的优化“极值”,如何依据“极值”建立统一的质量指标体系以指导业务优化?如何迁移抖音的服务经验,满足toB用户的体验需求?LiveVideoStackCon 2022北京站邀请到火山引擎RTC团队负责人——杨智超,为大家介绍在实...

2023-05-11 08:01:33 241

原创 云剪辑-B端在线剪辑⼯具架构设计与演进

腾讯云音视频的云剪辑致力于让客户在自己的应用(Web、小程序)中快速集成剪辑能力,同时强大的模板能力能够极大地提升视频生产效率。我们在探索B端在线剪辑产品的过程中遇到不少挑战:如何满足快速与定制两种集成场景?如何设计通用、高性能、可灵活拓展的渲染引擎?如何保证云端视频合成的效率与质量?LiveVideoStackCon 2022北京站邀请到了成锐林老师为我们分享他们团队是如何解答这一系列问题的。文...

2023-05-10 08:02:34 253

原创 ProRes Codec、浅压缩与产品经理

▲扫描图中二维码或点击阅读原文▲LiveVideoStackCon 2023上海正在招募讲师,扫码或阅读原文了解信息对于苹果或者摄影与后期重度用户应该了解ProRes吧,这是一种苹果私有的视频编解码标准,其提供卓越的图像质量与可观的压缩比,支持实时编辑应用,因此主要用于高质量的视频后期处理等场景。换句话说,ProRes在保证还原真实世界的数据信息前提下,提供了高速的压缩与解压缩能力,而获得的数据压...

2023-05-09 08:02:21 19

转载 【公开课预告】元宇宙直播的终端架构设计和关键技术

点击上方“LiveVideoStack”关注我们:互娱类直播产品经历过秀场直播、互动直播发展至今,产品形态上逐步见顶,探索新的互动方式成为主流直播平台新的风向标。2021年开始,『元宇宙』凭借其独特的新特征逐步进入直播领域。元宇宙+直播这种全新的融合方式成为时下互娱类直播新的突破口。5月16日 19:00,我们邀请到了百度智能云视频云资深研发工程师李明路老师围绕终端引擎技术发展与演进,详细介绍元...

2023-05-09 08:02:21 15

原创 “玲珑”编解码融合架构助力视频多元化需求

随着近年来 AI 技术的兴起,视频监控、汽车、智能家居、移动设备及数据中心等对高清视频处理有了越来越高的要求。安谋科技全新视频处理器——“玲珑”V6/V8,针对主流市场的视频流媒体技术进行了大量投入,通过一系列智能权衡实现了极大优化,为所有合作伙伴提供灵活的组合和选择。LiveVideoStackCon 2022北京站邀请到了安谋科技多媒体产品经理董峰,为我们分享“玲珑”编解码融合架构助力视频多元...

2023-05-08 08:00:22 162

原创 音视频技术开发周刊 | 292

每周一期,纵览音视频技术领域的干货。新闻投稿:contribute@livevideostack.com。谷歌将 AI 芯片团队并入云计算部门 追赶微软和亚马逊OpenAI推出的ChatGPT获得一定成功,微软是OpenAI的重要投资者,它将ChatGPT植入必应搜索,威胁到谷歌搜索地位。谷歌将会整合旗下两个AI研发实验室DeepMind和谷歌Brain,以增强公司AI部门实力。几行代码,GPT-...

2023-05-07 12:00:20 282

原创 LiveVideoStackCon 2023上海站 专题评审团招募正式启动

一路走来,专家评审团已经和LiveVideoStack联手两个年头了。从第一次小心翼翼的尝试,到后来越来越多的惊喜涌现,我们逐渐意识到,评审团已经成为了大会中不可或缺的一环。每一场干货满满的演讲背后,不仅有讲师的默默耕耘,还蕴藏着评审团成员们不厌其烦的修改建议,成就了一次又一次的高质量大会。因此,我们想在文章中正式邀请技术人们加入进来,组建本次的LiveVideoStackCon2023上海站大会...

2023-05-06 08:00:29 18

转载 AV夜话#9 王晶:聊聊音频技术与产品创新

▲扫描图中二维码或点击阅读原文▲LiveVideoStackCon 2023上海正在招募讲师,扫码或阅读原文了解信息上周五,与海蜂法务、海蜂坤行的联合创始人王莹交流了GPT在法律行业的机会。首先行业基本认为大模型加行业小模型的方式可行,但要在法律行业落地需要解决好数据安全和隐私问题。第二,在大模型成熟之前,法律行业就在探索自动化的提供法律服务的可能,比如法务咨询机器人等。直到大模型成熟后,行业开始...

2023-05-05 08:00:44 21

原创 QQ音乐银河音效技术实践——音乐重放效果的补偿与修饰

音效渲染是音频或音乐播放器最为重要的后处理模块之一。LiveVideoStackCon 2022 北京站邀请到腾讯音乐银河音效开发负责人——闫震海,为大家介绍银河音效在QQ音乐播放器中的创新应用,包括空间环绕效果和音效制作工具等内容。文/闫震海编辑/LiveVideoStack大家好!很高兴和大家一起分享交流关于QQ音乐银河音效的一些技术实践。相信大家对音效处理都不陌生。它已经被广泛应用在各种音...

2023-05-05 08:00:44 447

转载 动效素材极速交付: 腾讯PAG动效组件技术揭秘

编者按:音视频产品中的动效素材需求是源源不断的,例如贴纸花字,转场特效,照片和视频模板等,并且对它们的产量,上线速度,以及视觉效果都有比较高的要求。但在传统工作流中的交付成本却非常高,需要通过代码来手动还原设计师预设的动效内容。为了降低或消除动画相关的研发成本,腾讯内部历时 5 年研发了一套 PAG 动画工作流的解决方案,能够一键将 AE 动画内容导出并应用到几乎所有的主流平台。LiveVideo...

2023-05-04 08:03:58 37

转载 消除动效研发成本:腾讯 PAG 动效解决方案

本文作者陈仁健,腾讯 OVBU 媒资产品中心副总监,曾主导过开源 UI 框架 FlexLite 与 Egret 游戏引擎的设计研发。2018 年加入腾讯,作为腾讯多媒体技术委员会下 AVGenerator Oteam 核心 PMC 成员,持续专注在音视频编辑、图形图像特效、C++ 跨平台渲染等领域。主导研发的中台组件 PAG 动画解决方案已接入服务了 400+ 应用,包含微信、QQ、王者荣耀、小红...

2023-05-04 08:03:58 48

原创 音视频技术开发周刊 | 291

每周一期,纵览音视频技术领域的干货。新闻投稿:contribute@livevideostack.com。谷歌将 AI 芯片团队并入云计算部门 追赶微软和亚马逊OpenAI推出的ChatGPT获得一定成功,微软是OpenAI的重要投资者,它将ChatGPT植入必应搜索,威胁到谷歌搜索地位。谷歌将会整合旗下两个AI研发实验室DeepMind和谷歌Brain,以增强公司AI部门实力。Google De...

2023-04-30 12:03:30 726

原创 未来已来,大模型无处不在。音视频技术人,你准备好了吗?

“音视频领域正面临着一场人机交互体验的革命,是算力、连接、显示整个端到端革命的升级,市场也在呼唤着颠覆式的终端,现象级的内容以及全新的产业生态。”技术是从什么时候开始改变我们的生活的?打开电视,电影《瞬息全宇宙》为我们带来了一次视听上的顶级盛宴。飞速旋转的图片,背后是技术的把控和加持;手机里,“哪几种人将被人工智能取代?”的新闻在不停弹窗;便利店中,一个个由算法排列的货架会记住你对食物的偏好,并带...

2023-04-28 08:03:02 49

原创 建设元宇宙基础设施——PPIO边缘云在云渲染/云游戏的思考和实践

关于“元宇宙”的讨论越发火热,而建设元宇宙不可避免需要布设基础设施,LiveVideoStackCon 2022 北京站邀请到PPIO边缘云联合创始人——王闻宇,同大家探讨元宇宙网络时延的最优解–边缘云基础设施的架构与建设,并介绍PPIO边缘云在泛云游戏领域的一些思考和实践。文/王闻宇编辑/LiveVideoStack“元宇宙“源于1992年出版的美国著名科幻小说——《雪崩》(Snow Crash...

2023-04-28 08:03:02 393

原创 规模增长背后抖音如何构建直播体验优化

随着抖音直播用户持续增加,生态日渐丰富,在经历亿万规模化增长的过程之中,体验优化是必须要面对的问题,如何建立不同阶段的优化体系?如何抓住过程中的优化重点?另外面对业务增长诉求,面对新技术发展趋势,体验优化如何体现业务价值?新技术如何落地在业务之中?LiveVideoStackCon 2022北京站邀请到火山引擎直播技术负责人周一楠,分享抖音体验优化过程的一些探索与实践。文/周一楠编辑/LiveVi...

2023-04-27 08:01:22 414

原创 快手智能处理与编码算法产品化之路

视频转码过程中涉及方方面面的视频图像算法,如何将算法有机地结合起来,打造成为行业领先的视频转码算法产品?通过多年的业务场景打磨和积累,快手音视频走出了一条自己的产品化之路。LiveVideoStackCon 2022北京站邀请到了快手视频图像算法引擎负责人陈宇聪,为我们介绍视频图像引擎Atlas和智能转码算法框架CAPE的发展历程,以及「质臻影音」「质臻轻流」等转码产品的推出和应用。文/陈宇聪编辑...

2023-04-26 08:01:11 439

转载 【今晚7点】开放XCDN直播方案设计与实践

点击上方“LiveVideoStack”关注我们:随着AR/VR、超高清技术在直播场景的广泛应用,现有CDN(内容分发网络)面临新的要求,CDN架构朝向分布式、边缘下沉方向演进。然而,各级边缘资源分散、碎片、不稳定,接入复杂,如何高效利用这些资源仍是一个难题。今晚 7:00,我们邀请到了百度智能云视频云技术架构师柯于刚老师为大家介绍一种基于HTTP/3协议的直播方案,并详细解析如何采用统一协议...

2023-04-25 08:00:41 20

原创 腾讯多媒体实验室画质增强技术的前沿应用

全真互联时代,音视频技术内核不断更新迭代,LiveVideoStackCon 2022 北京站邀请到腾讯多媒体实验室视频技术研发负责人——夏珍,与大家分享画质增强技术的一些前沿探索和应用研究,在经典影像中非常重要的画质提升技术人脸修复和去压缩失真的能力,以及在腾讯视频和云游戏中能带来画质增强的技术。文/夏珍编辑/LiveVideoStack我是来自腾讯多媒体实验室的夏珍,一直从事视频处理技术的相关...

2023-04-24 08:00:10 163

原创 音视频技术开发周刊 | 290

每周一期,纵览音视频技术领域的干货。新闻投稿:contribute@livevideostack.com。TCSVT 2022 | 基于环路多帧预测的深度视频压缩本文基于端到端深度视频压缩框架,提出了一种环路多帧预测模块(in-loop frame prediction module),在不额外消耗码率的情况下,对当前帧实现基于多个参考帧的高效预测。汇聚音视频新能量 探索行业新蓝海作者从视频行业...

2023-04-23 12:03:10 142

原创 下一代听歌识曲技术——从信号处理到深度学习

音乐丰富我们的生活;音乐传达人类的情感;音乐表达人类的艺术。人类文明的进程中离不开音乐这个载体,音乐也离不开人类的真情创作。在听到好听却没听过的歌曲时,如何快速准确得到该歌曲的歌名成为当务之急。LiveVideoStackCon 2022 北京站邀请到了腾讯音乐的孔令城老师,为我们介绍QQ音乐在听歌识曲方面的成熟方案。文/孔令城编辑/LiveVideoStack下午好,我是来自腾讯音乐的孔令城 ,...

2023-04-21 08:02:38 403

转载 【公开课预告】开放XCDN直播方案设计与实践

点击上方“LiveVideoStack”关注我们:随着AR/VR、超高清技术在直播场景的广泛应用,现有CDN(内容分发网络)面临新的要求,CDN架构朝向分布式、边缘下沉方向演进。然而,各级边缘资源分散、碎片、不稳定,接入复杂,如何高效利用这些资源仍是一个难题。4月25日 19:00,我们邀请到了百度智能云视频云技术架构师柯于刚老师为大家介绍一种基于HTTP/3协议的直播方案,并详细解析如何采用...

2023-04-21 08:02:38 29

原创 如何破除增长的未知性?火山引擎交出了答卷

4月18日,由火山引擎主办的2023春季火山引擎“FORCE·原动力”大会在上海召开。本次大会主要围绕云计算和数字化领域,全方位地展示火山引擎在云技术、云服务和云场景方面的最新探索、应用与实践,呈现创新发展的战略蓝图。曾经,增长是一段充满未知的旅程。而在数字化飞速发展的今天,企业会因为各种内外部原因,遇到瓶颈,无法获得持续、有效的增长。云作为数字化的重要工具,始终是企业实现转型、应对未来市场变化的...

2023-04-20 08:00:31 295

原创 元宇宙场景下的实时互动RTI技术能力构建

元宇宙可谓是处在风口浪尖,无数的厂商都对元宇宙未来抱有非常美好的憧憬。正因如此,许许多多厂商都在用他们自己的方案,为元宇宙更快、更好的实现,在自己的领域贡献力量。LiveVideoStack 2022北京站邀请到了 ZEGO 即构科技的解决方案专家许明龙,为我们介绍 ZEGO 在元宇宙场景中的底层技术能力构建。文/许明龙编辑/LiveVideoStackZEGO即构科技,解决方案开发专家各位下...

2023-04-19 08:03:39 380

转载 【今晚7点】BRTC视频下行弱网对抗优化

点击上方“LiveVideoStack”关注我们:随着5G、云计算基础设施的成熟,RTC实时音视频技术迅速发展,已经渗透到日常生活的方方面面,如视频会议、互动直播、在线教育、5G云代驾、数字人、智能客服、元宇宙等等。随着更多业务场景的落地,用户对于体验的要求也越来越高,例如更低延时、更高画质、更高流畅度等。然而在复杂多变的网络环境中,这三者往往很难兼顾。在弱网情况下,实时性要求较高的场景一般会通过...

2023-04-18 08:01:05 22

原创 汇聚音视频新能量 探索行业新蓝海

视频行业卷成红海,如何突破瓶颈,去探索行业的新蓝海,本次LiveVideoStackCon 2022北京站邀请到快手高级副总裁、研发线负责人于冰,以《汇聚音视频新能量,探索行业新蓝海》为题,从视频行业趋势和痛点出发,结合快手自身的探索、演进历程,分享技术变革和突破的思路,寻求行业新增长点。文/于冰编辑/LiveVideoStack本次分享包括三部分,第一是行业困境,第二是寻求痛点即是寻求机会,第三...

2023-04-17 08:01:39 295

原创 音视频技术开发周刊 | 289

每周一期,纵览音视频技术领域的干货。新闻投稿:contribute@livevideostack.com。王小川入局大模型创业,称追上GPT-4需要3年左右搜狗创始人王小川正式对外宣布开启人工智能大模型领域创业。王小川与前搜狗COO茹立云联合成立人工智能公司百川智能,旨在打造中国版的OpenAI,研发并提供通用 AI 服务、基础大模型及颠覆性上层应用。比亚迪云辇,又给行业上了一课比亚迪正在用系统性...

2023-04-16 13:30:29 273

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除