自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

LiveVideoStack

分享音视频直播相关技术干货,产品研究与行业趋势。

  • 博客(2157)
  • 收藏
  • 关注

转载 LiveVideoStack暂停商业化运营

各位LiveVideoStack的朋友:感谢一直以来对LiveVideoStack的支持。由于业务方向需要调整,经公司慎重考虑决定,LiveVideoStack将于2024年3月8日起暂停商业化运营,具体安排如下:2024年3月8日零时起停止业务运营,2024年将不举办LiveVideoStackCon、LiveVideoStackMeet、LiveVideoStack Club等相关活动。同时,...

2024-03-08 17:59:50 210

原创 AIGC时代下阿里云视频云媒体内容生产技术实践

编者按AIGC时代下,媒体内容生产领域随着AI的出现也涌现出更多的变化与挑战。面对AI的巨大冲击,如何优化或重构媒体内容生产技术架构?在多样的应用场景中媒体内容生产技术又有着怎样的实践效果?LiveVideoStackCon2023深圳站邀请到阿里云智能资深技术专家邹娟,与大家分享阿里云视频云的媒体内容生产技术实践。文/邹娟整理/LiveVideoStack大家好,很荣幸来到LiveVideoSt...

2024-03-01 10:01:59 765

原创 水下图像质量评价与画质增强研究

编者按海洋面积占据地球总面积的大部分,而且海洋世界蕴藏着丰富的资源,围绕水下成像的相关研究和应用越来越重要。但是,收到水下光照散射、吸收以及噪声等影响,获取的水下图像普遍存在颜色偏差、清晰度差等问题。LiveVideoStackCon 2023 深圳站邀请到福州大学赵铁松老师讲解水下图像质量评价与画质增强研究案例。文/赵铁松整理/LiveVideoStack大家好,我是赵铁松,今天向大家分享水下图...

2024-01-30 20:01:15 1150

原创 智能音频能力移动端落地实践

编者按端上智能音频能力包括语音识别和声音事件检测等技术,此技术对互联网社交、游戏直播等场景非常重要。但端上智能音频技术也存在效果、性能、数据等方面问题。LiveVideoStack2023深圳站邀请到趣丸科技的马金龙老师讲解智能音频能力移动端落地实践,对这几个问题一一进行回答。文/马金龙整理/LiveVideoStack大家好,我是马金龙,在多媒体算法开发方面有10年的经验,涉及音视频图像文本,音...

2024-01-29 20:01:17 933

转载 「线上分享」采用Zynq系列FPGA实现NDI AV over IP 应用

IP为AV over IP带来更多可扩展切换的可能,打破传输距离的障碍,提高了输入与输出设备的数量,超越了本地化的视频标准,与数据和通信的融合更密切。长沙千视希望采用AV over IP为自身的NDI技术赋能,实现更好的场景部署。NDI的特点是需要软件的协议和处理,通过Zynq在逻辑端实现NDI的编解码算法,在ARM端跑NDI的SDK以及网络的收发。这样的一种分工协同就实现了技术的最大化利用。被称...

2024-01-26 10:33:55 111

转载 「线上分享」基于AMD MPSoC的AV over IP创新解决方案

ProAV系统是利用视音频进行信息采集、传输、处理、呈现,以及人机交互等的信息技术,是处理和呈现信息提供帮助的一种信息系统的统称。ProAV系统应用较为广泛,在会议交流、监控指挥、文化演艺、军事培训等领域得到应用,成为提升信息传输质量、提升工作效率的有效手段。随着行业的不断发展,更多的挑战随之出现。不同的设备有不同的接口和不同的协议。反复讨论对比后,伟乐科技选择了AMD MPSoC器件来构建基于I...

2024-01-25 09:51:44 83

转载 「线上分享」AMD面向8K UHD应用解决方案

如今,8K 已成为超高清( UHD )视频的最新标准,其分辨率是 4K 的四倍,是全高清的十六倍。8K 视频在专业媒体中越来越受欢迎,并在消费类应用中兴起。在本次分享中,AMD将会和大家一起探讨为何采用 8K 视频、其优势和潜在缺点、在连接、处理及压缩 8K 内容方面的技术挑战,以及 AMD 平台如何通过AV over IP的概念给整个行业做进一步提升。本次分享,来自AMD 工业与视觉系统架构师...

2024-01-24 08:01:08 90

原创 对话特看科技滚石:入局数字人的第一年,当深耕“AI+视觉”的技术团队离开大厂...

采访对象|滚石策划、撰写|李美涵作为一家成立于去年的初创公司,特看科技团队保持着对趋势的敏锐和果决。时间回溯到2017年,当核心团队在阿里巴巴智能设计平台工作时,便开始了对机器学习与电商广告设计相结合的探索,开发了AI生成海报的“鲁班”系统。凭借着一秒几千张海报的超高产能,及智能推荐算法下广告海报千人千面的精准投放,阿里鲁班在设计圈名声大震。其后,团队精准预判了互联网图文的发展已逼近天花板,便转型...

2024-01-23 08:01:15 1057

转载 「线上分享」基于FPGA的DSP并行处理下一代汽车音频解决方案

随着新能源车的普及,消费者对于车的关注从驾驶性能需求转移到多方面的乘用体验,尤其多媒体体验中,声音是必不可少的。在汽车声学处理中,车内的小空间、不规则的镜面反射、多座位的声学适配和多种格式的音响节目适配一直是难题,传统的声学技术无法解决以上的问题。想要提升音频体验,就要跳出传统的声学DSP处理技术和调试方法,使用最新的声场合成技术能够完美地解决以上难题,但是声场合成技术也会遇到瓶颈。功耗、处理能...

2024-01-22 08:02:41 75

转载 「线上分享」JPEG2000在视频分布式中的应用

在音视频编解码领域,以H.264/H.265为代表的深压缩编解码算法一直占据着行业的主流。随着视频编解码的需求增多,浅压缩算法逐渐得到了重视。JPEG 2000曾获认为是未来取代JPEG的下一代图像压缩标准相较于主流的潜压缩JPEG来说,JPEG 2000压缩比更高,体积更小,并能同时支持有损/无损两种压缩方式。北格逻辑是专注于FPGA的音视频解决方案提供商,其提供的JPEG2000编解码算法能够...

2024-01-19 08:15:00 94

转载 对话阿里云何亚明:多媒体的未来,正迎面未知的高速列车

ru'guo抓住已知的,迎面未知的。CloudImagine编者按:大模型、降本、出海,是多媒体从业者交流的高频词,内容与交互的需求层出不穷,大模型与AI的演进目不暇接,让增速低走的视频云迎面新的机遇和挑战。作为一个跨越中美多媒体行业20年的亲历者(阿里云视频云负责人何亚明),与他的对话展现出一番场景,他没有否认多媒体生态当下的问题,但他说新的机会就在眼前,更重要的是,他对多媒体满怀希望。策划 ...

2024-01-18 19:54:27 98

转载 「线上分享」AMD专业音视频总览及更新

我们的生活离不开专业的音视频设备。从零售广告中的数字标牌,到现场活动中的麦克风和大屏幕显示;从体育赛事的现场直播到行业的实时监控……如何在不牺牲视频质量、延迟或控制的前提下进行成本效益设计,是专业音视频平台需要仔细考虑的问题。AMD 平台可快速适应新兴音视频技术的要求,可通过 AV-over-IP 的方式,采用无损压缩或者深压缩方式进行高质量音视频传输,并在成本优化的器件中集成支持最新 AI/ML...

2024-01-17 08:59:52 59

原创 B站蔡春磊:转码系统究竟在优化什么?

编者按转码主要有三个目的:提高码流的兼容性、改善画质和降码率省带宽。转码系统对公司的带宽和体验是非常重要的,尤其在降本增效大背景下。LiveVideoStackCon 2023 深圳站邀请到哔哩哔哩公司蔡春磊老师讲解B站降低码率相关的原理和实践。文/蔡春磊整理/LiveVideoStack大家好,我是蔡春磊。今天和大家分享一些关于转码系统优化原理的思考。我毕业后加入哔哩哔哩,主要从事传统实用转码系...

2024-01-16 08:00:22 880

原创 详解Enhanced-RTMP支持H.265

编者按:很长时间以来,国内CDN都是通过“CodecID=0xC”的设置来实现H.265支持,但这未能彻底解决CodecID只有4个bits的尴尬,未来RTMP无法支持更多的编码标准。Enhanced-RTMP会彻底解决这一问题。如果你有兴趣分享自己的经验和思考,可以通过[email protected]联系我们。文 / 小新快跑千呼万唤使出来,rtmp/flv算是有统一支...

2024-01-03 08:00:32 1056

原创 音视频技术开发周刊 | 326

每周一期,纵览音视频技术领域的干货。新闻投稿:[email protected]。全球最强「开源版Gemini」诞生!全能多模态模型Emu2登热榜,多项任务刷新SOTA最强的全能多模态模型来了!就在近日,智源研究院重磅发布了开源界的「Gemini」——Emu2,一口气刷新多项SOTA。成立2年融资近9亿!AI NPC引爆游戏行业巨变,微软等大厂已经入局成立2年融资近9亿!A...

2023-12-31 10:01:37 1285

原创 网易云商冯旻伟:“大模型是下一代信息系统的大脑”

编者按AIGC时代,大模型在智能客服领域的应用一直备受关注,其不断演进的技术给用户体验和业务效率带来了全新的可能性。近日,我们有幸采访了网易云商AI技术线的负责人冯旻伟,深入了解了他们在智能客服方面的创新和实践。从文字交互到语音交互,AIGC的应用正在为用户提供更智能、高效的服务。在未来,随着大模型的多模态能力持续完善,AI将为智能营销与智能客服业务注入更多活力。以下是这场专访的一些精彩片段,一同...

2023-12-29 08:01:06 923

原创 座舱音频系统的架构设计和音频体验

编者按近年来,智能座舱体验日益成为汽车竞争力的核心,智能座舱的多样体验正在成为用户购车时考虑的重要因素。LiveVideoStack2023深圳站邀请到蔚来汽车座舱音频系统软件负责人高林,从主流音频架构设计、算法集成方案及体验影响、音频体验与整车融合的挑战三个方面,为大家介绍音频软件架构设计是如何影响智能座舱体验的。同时他希望通过此次分享,呼吁业界各方共同努力,大胆革新,化机遇为挑战。文/高林整理...

2023-12-28 08:00:29 1473

原创 腾讯云音视频的创新技术、多元场景以及出海洞察

编者按近年来,腾讯云音视频在音视频技术领域不断突破创新,从采集、编码、传输加速、云端媒体处理、分发到解码,不断探索前沿技术,并将其广泛应用于多元化的场景中。与此同时,在海外市场的实践中,腾讯云音视频积累了丰富的经验和对市场的深刻洞察。LiveVideoStack2023深圳站邀请到腾讯云音视频的总经理李志成分享腾讯云音视频的创新技术、多元场景及出海洞察。文/李志成整理/LiveVideoStack...

2023-12-27 08:01:05 1449

原创 低延时视频技术的应用场景和挑战

编者按无线网络对人们的生活产生了巨大的影响,而5G技术的引入将彻底改变我们与世界互联互通的方式。在5G时代,实现万物互联离不开低延时技术的应用。LiveVideoStackCon 2023 深圳站邀请到秒点科技的CEO扶凯,为大家分享低延时技术在物联网、远程协作、云游戏等领域的创新应用,分析该技术所面临的技术挑战和市场壁垒,同时就如何打造一家具备全球竞争力、超越抖音等强势竞争对手的低延时视频技术公...

2023-12-26 08:01:04 347

原创 音视频技术开发周刊 | 325

每周一期,纵览音视频技术领域的干货。新闻投稿:[email protected]。AI读心术震撼登顶会!模型翻译脑电波,人类思想被投屏|NeurIPS 2023在最近举办的NeurIPS大会上,研究人员展示了当代AI更震撼的应用场景——AI读心术!OpenAI「登月计划」剑指超级AI!LeCun提出AGI之路七阶段,打造世界模型是首位OpenAI「登月计划」笃定了超级人工智...

2023-12-24 10:01:35 502 1

原创 特别策划:我们距AIGC的“奇点”还有多远?

AIGC可能是当前科技圈最不容许忽视的趋势。根据咨询公司预测*,2023年中国AIGC产业规模约为143亿元,随着底层算力与大模型的完善,有望在2030年突破至惊人的万亿级。AIGC技术的落地正被无数双眼睛殷切关注着。在与商业价值联结最为紧密的应用层,生成式语音、图像及视频、虚拟数字人无不与多媒体生态息息相关。可以预见,AIGC的热潮必然在多媒体领域中激起千层浪,带来从生产端到消费端全链条的巨大变...

2023-12-22 08:01:34 156

转载 AVS3实时语音标准制定取得重要进展

编者按:由腾讯提交的AI Codec为基础的技术顺利通过评审,被选为AVS3P10实时语音编码标准的RM0基线和WD过点成功。从交叉测试来看,真正实现了低码率下质量是对齐OPUS、EVS中高码率的,达到运营级质量。我们在相近码率下,MOS分差过Google和Meta方案在0.6MO-1.0MOS。AVS对此高度评价,“AVS3P10 实时语音编码,作为新一代的语音编解码技术标准,是对AVS系列标准...

2023-12-20 08:00:18 143

转载 美图AI动漫功能的落地探索

编者按2022年可以说是AIGC技术的元年,LLM领域的GPT和图像领域的Stable Diffusion,都属于行业的颠覆性技术。在图像领域,业界出现了如DALLE,Midjourney等基于简单描述文本生成图像的模型和工具。美图在2022年以来,发布了多项AIGC相关应用,LiveVideoStackCon 2023深圳站 邀请到了美图 影像研究院李骈臻老师分享相关经验。文/李骈臻整理/Liv...

2023-12-20 08:00:18 96

原创 依靠HDR-VMAF,Netflix的HDR视频已全部实现动态优化

编者按:据11月30日Netflixtechblog显示,Netflix现已推出动态优化 HDR(高动态范围) 视频流功能。该功能使用了新的算法HDR-VMAF,提升了用户的观看体验。Netflix于2016年开始推出HDR视频,此后其提供的HDR影片数量一直持续增长。HDR视频可以提供更广泛的色彩和更高的对比度,从而提供更趋近真实的图像。受限于不同设备和网络条件的差异,HDR视频的播放质量会受到...

2023-12-18 08:15:52 184

原创 音视频技术开发周刊 | 324

每周一期,纵览音视频技术领域的干货。新闻投稿:[email protected]。467亿参数MoE追平GPT-3.5!爆火开源Mixtral模型细节首公开,中杯逼近GPT-4今天,Mistral AI公布了Mixtral 8x7B的技术细节,不仅性能强劲,而且推理速度更快!还有更强型号的Mistral-medium也已开启内测,性能直追GPT-4。8x7B开源MoE击败...

2023-12-17 10:00:26 189

转载 抖音赛事直播体验优化实践

编者按赛事直播吸引着亿万观众的眼球,流媒体直播对于音视频技术提出了更高的要求。LiveVideoStackCon 2023深圳站邀请到火山引擎视频直播CDN技术负责人刘振华,为我们介绍火山引擎视频直播在抖音赛事直播中体验优化中积累的实践经验,他将从多视角、清晰度(画质)、延迟、稳定性多视角介绍火山视频直播是如何在大型赛事中实现好的流媒体观看体验。文/刘振华整理/LiveVideoStack大家好,...

2023-12-15 08:00:27 110

转载 AI新范式下,阿里云视频云大模型算法实践

编者按在AI技术发展如火如荼的当下,大模型的运用与实践在各行各业以千姿百态的形式展开。音视频技术在多场景、多行业的应用中,对于智能化和效果性能的体验优化有较为极致的要求。如何运用好人工智能提升算法能力,解决多场景业务中的具体问题,需要创新地探索大模型技术及其应用方式。LiveVideoStackCon2023深圳站邀请到阿里云智能高级算法专家刘国栋,为我们介绍阿里云视频云的大模型算法实践。文/刘国...

2023-12-14 08:02:31 718

转载 超燃!全球边缘计算大会,腾讯、阿里、百度等携手打造前所未有的AI知识盛宴!...

????????重磅好消息!第八届全球边缘计算大会火热来袭!2023全球边缘计算大会·上海站作为今年的压轴之作,绝对是边缘计算领域最值得参加的会议之一,也有可能是12月AI边缘计算领域人气最旺的会议哦!为什么说这是今年最值得参加的AI边缘计算会议呢?因为我们用了长达6个多月的时间精心筹备,我们坚信会议的核心在于内容的质量。这次,我们把边缘计算第一梯队腾讯、阿里、百度、中国移动、戴尔、英特尔、联想、算能、EMQ...

2023-12-13 08:02:40 273

转载 RTC技术|弹幕互动玩法方案&低延时传输引擎的体验优化

#1抖音创新玩法背后的RTC技术应用——弹幕互动玩法方案实践编者按随着互联网技术的不断发展,直播不再只是主播的独角戏,而是一个充满实时互动的娱乐生态系统,其中直播弹幕互动玩法作为一种创新的方式正风靡直播平台。火山引擎融合云游戏服务的强大算力和RTC的先进音视频能力,助力抖音快速增量并拓展直播创新玩法。LiveVideoStackCon 2023 深圳站邀请了火山引擎的郭健,为大家分享弹幕互动玩法背...

2023-12-13 08:02:40 152

原创 音视频技术开发周刊 | 323

每周一期,纵览音视频技术领域的干货。新闻投稿:[email protected]。Meta牵头组建开源「AI复仇者联盟」,AMD等盟友800亿美元力战OpenAI英伟达超过50家科技大厂名校和机构,共同成立了全新的人工智能联盟。以开源为旗号,誓于OpenAI和英伟达一决高下。深度学习大牛权威预测2024年AI行业热点,盘点开源AI趋势!AI社区大佬Sebastian总结了...

2023-12-10 09:59:59 726

转载 数据赋能音视频业务降本增效—— 基于最佳实践的顾问式服务

编者按随着全行业视频化的趋势,对视频云的需求已从最初的功能完善、弹性可扩展,演进到提升业务体验、支撑业务增长和优化业务成本。LiveVideoStackCon2023深圳站邀请到了火山引擎的周天杨,基于火山引擎视频云服务内外部业务经验沉淀,为大家介绍数据驱动助力业务降本增效的方案与实践。文/周天扬整理/LiveVideoStack大家好,我是火山引擎视频云产品经理周天扬,很高兴有机会和大家一起分享...

2023-12-07 08:01:13 58

转载 揭秘网宿基于新一代QUIC协议的优化实践

近日,LiveVideoStackCon 2023音视频技术大会深圳站成功举办。流媒体应用场景日趋多样,TCP协议在弱网场景下表现不佳,而QUIC以其低延迟以及灵活的传输算法更加适用于各种网络环境下的媒体传输。会上,网宿科技流媒体研发经理庄晓川与多位行业资深专家共同探讨,QUIC在应对复杂网络环境下的传输能力,以及网宿科技在QUIC协议上的优化实践。庄晓川认为:QUIC已经成为WebTranspo...

2023-12-05 10:45:55 97

转载 活动|RTSCon强势回归

从2012年的车库咖啡开始,FreeSWITCH开发者沙龙(现更名为RTSCon)兜兜转转已经举办了十一届,十一年一年一届从未缺席。今年是第十二届,十二年弹指一挥间,我们已经跟大家见过很多不同城市的春夏秋冬,这一次我们再次回到最初的地方——北京。(沙龙快剪)本次RTSCon2023由RTS社区主办,大会合作伙伴有RTE开发者社区,LiveVideoStack,稀土掘金社区,中关村Innoway,S...

2023-12-05 10:45:55 83

原创 音视频技术开发周刊 | 322

每周一期,纵览音视频技术领域的干货。新闻投稿:[email protected]。超级AI不会主宰人类,但人工智能必须开源!LeCun最新采访引全网300万人围观LeCun最新访谈视频中,再次坦露了自己对开源AI的看法。超级AI终有一天会诞生,但不会主宰人类。GPT-4+物理引擎加持扩散模型,生成视频逼真、连贯、合理扩散模型的出现推动了文本生成视频技术的发展,但这类方法的计...

2023-12-03 10:00:12 412

原创 LiveVideoStackCon 2023 深圳站优秀出品人、讲师及志愿者

LiveVideoStackCon 2023深圳站已圆满结束。在正式见面之前,大会历经长达5个月的精心筹备,旨在向所有参会者呈现兼具深度与广度、展示前沿创新的音视频技术内容。在此,我们想要感谢共同创造了此次大会的所有人。感谢每一位出品人、讲师,把控专题内容,打磨出一流的演讲内容;感谢志愿者以及其他伙伴的帮助,正是你们的付出才能使大会的每一环节都顺利执行;感谢我们的赞助商以及合作伙伴,你们的支持是我...

2023-12-01 10:35:24 81

原创 从LiveVideoStackCon 2023深圳看音视频的未来

今天是LiveVideoStackCon 2023深圳的第二天,今天大会结束之后,也意味着我们今年主要的活动都告一段落了。正好借这个机会简单总结下当下的多媒体生态,并展望下未来。《2024音视频技术发展报告》发布腾讯云音视频总经理 李志成Google高级工程师 陈诚北京大学助理教授&博士生导师高伟主题演讲VIP社交晚宴降本与出海对于国内的大部分音视频团队而言,当下最重要的任务就是降本,这...

2023-11-25 08:40:40 158

转载 LiveVideoStackCon回归深圳 《2024音视频技术发展报告》发布

大约1400多天前,LiveVideoStackCon首次来到深圳。和今年一样,那一年我们也交付了三场大会,只不过今年的第一场北京站其实是2022年延期而来。那一年非常疲惫,也非常幸运。如果不是2019年有过第一次,大概率今年也不会来深圳了,这可能是无法弥补的遗憾。正如大家感受到的一样,多媒体生态的困局投射在每一名从业者身上。你不可能改变行业的急转直下,正如不可能改变当初千播大战、疫情点燃整个行业...

2023-11-24 10:00:44 195

原创 重磅首发|2024音视频技术发展报告(文末附下载)

//11月24日,在LiveVideoStackCon 2023深圳站大会上,我们与腾讯云音视频联合首发《2024音视频技术发展报告》。报告通过300+音视频开发者调研,40+专家一线访谈,下沉8大细分技术领域进行全面解读,涵盖音视频编解码/AI编码/多媒体处理框架/媒体传输协议/超低延迟技术/虚拟现实/AIGC/出海等领域,深入洞察音视频技术现状和未来发展趋势。//报告主要分三个篇章,从音视频核...

2023-11-24 10:00:44 178

原创 如何打造“面向体验”的音视频能力——对话火山引擎王悦

编者按:随着全行业视频化的演进,我们置身于一个充满创新与变革的时代。在这个数字化的浪潮中,视频已经不再只是传递信息的媒介,更是重塑了我们的交互方式和体验感知。作为字节跳动的“能力溢出”,火山引擎正在飞速奔跑。根据2023《中国视频云市场跟踪,2023上半年》报告显示,在视频云解决方案市场上,火山引擎的市场占有率排在第五位。从在北京创业时听着路演写代码,到成为火山引擎视频云架构的技术总监,王悦的经历...

2023-11-23 10:10:57 638

转载 于AI中见天地:从大模型到内容生成

视频云AI「进化手册」CloudImagine近日,国际知名研究机构Gartner发布2024年十大战略技术趋势,人工智能成为其背后共同的主题。全民化的生成式人工智能、AI增强开发、智能应用......我们正在进入一个AI新次元。从ChatGPT的横空出世,到开发者大会的惊艳亮相,OpenAI以一己之力掀起生成式AI产业变革。与此同时我们也看到,AI正以超乎想象的进化速度,给云服务带来了更多机遇...

2023-11-21 08:02:42 82

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除