音视频技术开发周刊 | 282

每周一期,纵览音视频技术领域的干货。

新闻投稿:contribute@livevideostack.com。

eeb6712e120561655422bd3662241e53.jpeg

畅谈音视频未来无限可能,2022音视频技术大会北京站 最新日程公布

2023年3月31日-4月1日LiveVideoStackCon 2022音视频技术大会北京站,我们将一同畅谈多媒体生态发展,探讨音视频的未来无限可能,探索行业与新技术的融合碰撞。


778aa0488c9f0731b6414b2aa5dc32cf.png

ChatGPT背后的核心技术

原本这篇论文是聚焦在自然语言处理领域,但由于其出色的解释性和计算性能开始广泛地使用在AI各个领域,成为最近几年最流行的AI算法模型,无论是这篇论文还是transformer模型,都是当今AI科技发展的一个缩影。以此为前提,本文分析了这篇论文的核心要点和主要创新初衷。

结合ChatGPT的微软New Bing体验到底如何

2 月 7 日,微软 CEO Satya Nadella 在发布会上宣布,发布 ChatGPT 版搜索引擎 New Bing。发布会上 Nadella 称,"It's a new day for search... The race starts today" ,可以看出微软对其 Bing 搜索引擎的全面改革战略意义重大。必应目前仅占全球搜索量的 3%,而谷歌则占 93%,微软难得的机会来宣称技术优势,因为搜索市场面临多年来的首次重大变化,利用集成 ChatGPT 技术,对谷歌在搜索引擎市场长达 20 年的主导地位发起了前所未有的挑战。

打造中国版 ChatGPT,国内有哪些学术力量能抢滩?

本篇旨在从学术研究的角度出发,对国内各大潜在力量在这一波 ChatGPT 竞赛中的位置进行盘点。

复旦邱锡鹏团队发布类 ChatGPT 模型 MOSS,现已暂停内测

当下,ChatGPT 无疑已是全球人工智能领域最炙手可热的现象级模型,MOSS 的出现,是类 ChatGPT 模型在国内的一次尝试,对学术界和产业界来说,都是不小的激励,也为其他研究团队提供了经验,将助力大语言模型的进一步探索和应用。

b273f6eb8a5cddd81e61e09a2a52d9bd.png

AIGC全球独角兽大盘点:AI自动画图领域,6家企业上榜

本篇文章将为大家盘点AIGC图片领域的全球独角兽,为产品研发、场景赋能、技术创新、商业模式等提供借鉴。

16647f954fa0c67b38144493decae227.jpeg

VR硬件技术的下下下一步——“MEC”

本文将从移动边缘计算的定义、工作原理,衔接到具体在 VR 头显中可落地应用场景,试图解答移动边缘计算在 VR 中的重要性及前景。

Matthew Ball:十多年后AR/VR为何依然发展缓慢?

回顾过去的AR/VR发展,投资人Matthew Ball发表了万字长文,详细分析了我们想知道的许多问题,比如:为什么AR/VR头显还没有取代手机,这项技术差在哪,到底还要走多久?此外,也解释了许多人对AR/VR技术的一些误解。

b2d44d4253abae59063c16c32adb0eff.png

海量并发低延时 RTC-CDN 系统架构设计(上)

海量并发低延时 RTC-CDN 系统架构设计(下)

本文将重点分享:网易云信如何构建 RTC-CDN 服务架构,深入剖析这套架构是如何解决海量并发、超低延时与低成本三大行业核心诉求,并结合低延时直播和元宇宙两大场景,为大家讲解 RTC-CDN 的核心技术和最佳实践。上篇文章主要介绍:背景介绍,以及构建海量并发流媒体服务架构;下篇文章主要介绍:构建低延时 RTC-CDN 架构、低延时 RTC-CDN 场景化技术实战、总结与展望

8572c19cd48b382b7d51c43a00251ea7.png

发布视频卡顿有延迟?海事卫星加上TA,“船岸互通”不再难

如何突破有限通信带宽的限制,提升远程视频回传速率,当虹科技推出窄带宽条件下智能视频压缩回传解决方案。基于“视频编码”与“AI识别”双引擎,赋能远洋船舶视频传输与智能化转型。

抖音世界杯的画质优化实践

世界杯赛事涉及链路众多,如何保障各链路的画质稳定并进一步提升画质,是一个巨大的挑战。本文主要介绍火山引擎多媒体实验室在世界杯期间画质的相关工作。

353129fc46a0dfe51e62107a76b1cf86.jpeg

3D成像技术介绍

LiveVideoStack邀请到了螳螂慧视的骆晓峰老师,为我们介绍3D成像技术。

AAAI 2023|优图16篇论文速览

今年腾讯优图实验室共有16篇论文入选,内容涵盖了多标签分类、姿态估计、目标检测、HOI、小样本学习等研究方向,展示了腾讯优图在人工智能领域的技术能力和学术成果。本文介绍了腾讯优图实验室入选论文及方法概述。

83dfcaa2370fdf89f556f540490e165e.png

美团视觉GPU推理服务部署架构优化实践

面对在线推理服务使用的GPU资源不断增加、GPU利用率普遍较低的挑战,美团视觉研发团队决定通过模型结构拆分和微服务化进行优化,他们提出了一种通用高效的部署架构,来解决这种常见的性能瓶颈问题。以“图像检测+分类”服务为例,优化后的服务压测性能指标GPU利用率由40%提升至100%,QPS也提升超过3倍。本文将会重点介绍推理服务部署架构优化的工程实践,希望对大家能有所帮助或启发。

dd44aa79c9c01e94acc6865473a7f392.png

FOSDEM 2023 | 双重展示: FFmpeg 6 和 VLC.js

知名多媒体开发者兼 VideoLAN 总裁 Jean-Baptiste Kempf 回顾了 FFmpeg 5.0 版本和 5.1 版本中的改进,并对 FFmpeg 6.0 新版本中的内容进行了分享,还对 VLC 及其依赖项使用 wasm 编译到 Web 浏览器,并使用 Webcodecs 解码视频进行了演示。


阅读/资源推荐

【作品】WebRTC+ChatGPT实现语音聊天机器人

https://www.bilibili.com/video/BV1ty4y1Z7V1/?spm_id_from=333.999.0.0&vd_source=f0ab33d7a845fb475b17a70478dc9146

活动推荐

9900559386bc02f0c84409bf2338f251.png

【公开课】基于AI和NPU的Codec变革

伴随通信容量(包括5G以及千兆有线网络)的发展,高带宽为更多用户接入超高清视频提供了可能。但是随着用户数量的增加,高质量的压缩方案也是变得更迫切,而边缘计算平台的性能提升也为解码增强提供了算力支持。AI算法的进步则提供了更丰富的计算方式。

时间:fb220465ff5ee0bb3467222ac40f7981.png2023年3月2日 19:00

报名:36f1b8a01d538520e08996920d129cc4.png扫码关注LiveVideoStack小秘书,获得观看方式。

25e549407168f9346c1f45ade0300d8a.jpeg

“中国好SaaS”大赛由中国最大的技术高管社区、钛媒体旗下ITValue在2016年首次发起,基于广泛的行业影响力和高度垂直的信息化决策人社群,帮助有能力、有潜力的SaaS企业高效链接业务需求方和投资机构,助力优质SaaS创业企业获得更多的发展机会。点击【阅读原文】了解更多详细信息,报名参与。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值