音视频技术开发周刊 | 190

本文汇集了音视频技术领域的最新资讯和深度文章。涉及话题包括:CPU历史、ST 2110视频传输技术、谷歌的Lyra音频编解码器、直播视频的幕后故事、腾讯云音视频通信的探索、实时音频的技术变迁和机遇,以及VR、AI在制造业的应用。同时,还介绍了图像修复和去反光算法的进展,以及即将举行的音视频技术大会。
摘要由CSDN通过智能技术生成

每周一期,纵览音视频技术领域的干货。

新闻投稿:contribute@livevideostack.com。

漫画 | 20多年了,为什么国产CPU还是不行?

故事得从IBM发明PC兼容机开始。当年, IT巨佬IBM选中了一个名叫Intel 的小公司来提供PC芯片, 但是提出了一个额外的要求……

使用ST 2110来最大化视频传输密度

本文来自The Broadcast Knowledge,来自Bright的Guillaume Arthuis和来自Matrox的Marwan al-Habbal为我们介绍了SMPTE ST 2110以及该技术能够解决的问题。

Lyra——为下一个十亿用户提供语音通话服务

过去的一年证明了在线交流对我们的生活是多么重要。无论你在哪里,无论网络条件如何,在网络上清楚地了解彼此是前所未有的重要。这就是为什么我们在2月份推出了Lyra:一种革命性的新型音频编解码器,使用机器学习产生高质量的语音通话。

https://opensource.googleblog.com/2021/04/lyra-enabling-voice-calls-for-next-billion-users.html

关于直播视频:你可能不知道的事——专访淘系技术资深总监陈颖

从学术研究到工业界产品化;从视频编解码到标准迭代;从虚拟人物直播到电商直播……关于直播视频,多得是你可能不知道的事。

从腾讯云音视频通信,看全真互联网下的新机会——对话腾讯云副总裁李郁韬

2006年从电子科大毕业后,Tommy 就进入了腾讯。他从 QQ 后台应用做起,做了近十年的后台研发工作。2016年后,Tommy 开始负责云业务,从产品到后端,从互动直播、云直播到即时通信IM,他陪伴腾讯云开疆拓土,一路上且行且忧,不曾懈怠。

2021 技术展望 | 实时互动场景下,音频的技术变迁与机遇

本文采访了声网 Agora 音频体验与工程总监陈若非,请他来聊一聊在实时互动场景下音频技术的变迁与机遇。

Live Streaming 2020:提供广播质量体验

本文来自MediaKine的网络研讨会,来自Mediakind公司Aquila Streaming部门的高级产品经理Thomas Fayoux为我们回答了如下问题。为什么低延迟OTT会改变游戏规则?技术如何帮助解决这些挑战?MediaKind的Aquila流媒体低延迟OTT解决方案如何帮助媒体运营商提供独特的消费者体验。

刷新视频超分新记录28.41dB!同时利用过去和未来隐状态的全局视频超分方案OVSR

本文是武汉大学&哈尔滨工业大学&武汉理工在视频超分领域的一次突破性的成果。在深入分析多帧超分、递归超分以及混合框架超分存在的问题之后,本文创造性的提出了同时利用过去和未来隐状态的全局视频超分方案OVSR。刷新了Vid4、UDM100的指标,达到了前所未有的28.41dB的性能。

per-title编码视频

本文来自Streaming Media,Jan Ozer和 Abdul Rehman介绍了per-title编码视频的发展。

【前沿技术】2021年AI将改变制造业的6大应用趋势

如今制造行业流行的是什么?我想,这可少不了“数字转换”、“工业4.0”、“人工智能(AI)”...

揭秘人工智能背后鲜为人知的人工力量——数据标注

尽管随着AI的普及,我们在生活中越来越依赖于人工智能,但“人工智障”的相关调侃也从来没有消失过。

看完 50000 张专辑封面,AI 设计师开始疯狂输出

西班牙艺术家利用 StyleGAN2 打造了一个 AI 设计师,借助 50000 张图像自学成才,没想到培养一个印象派设计师这么简单。

3月VR大数据:App Lab猛增100多款,Quest 2一骑绝尘

目前,Steam平台对于VR设备的统计更加细分,除了常规PC VR机型,还加入Oculus Quest(区分1代和2代)、PSVR机型,整体的硬件统计更为清晰。

眼球追踪VR+面部追踪模块,网友打造最强MetaHuman虚拟人方案

MetaHuman未来在虚拟场景的应用,其潜在应用场景将包括:游戏、社交、影视娱乐、虚拟偶像等等。

为什么说多感官交互对VR培训更重要?

VR用于培训的优势是可为使用者提供一个安全、低成本、高效率、有趣的学习环境。VR所带来的逼真、沉浸的视觉效果,被认为可以提升学习和培训效果。

复兴or幻象?VR的2021三重门

从2020年底开始,无论你日常看一些数码博主的评测,还是喜欢了解科技产业的动态、投融资的报道,都能在媒体中了解到这么一个信号:2021,VR复兴了!

深度图像修复的一个突破

我们将深入探讨深度图像修复的一个突破,上下文注意力。通过使用上下文注意力,我们可以有效地从遥远的空间位置借用信息来重建局部缺失的像素。这个想法实际上或多或少和上一篇的复制-粘贴是一样的。让我们看看是如何做到的。

图像反光能被一键去除了?港科大开源RFC,仅用一个操作,强反光也能完美去除|CVPR2021

本文介绍一篇来自香港科技大学中稿CVPR2021的工作,工作采用了硬件和软件结合做底层图像处理的方法,主要介绍了一种鲁棒性和精确性都很强的去反光算法,在定量指标和视觉效果上都显著超过了其他的算法。

Google Lyra Android版开源 支持3kbps语音聊天

据悉,开源发布的Lyra代码是用C++编写的,以提高速度、效率和互操作性,使用了带有Abseil的Bazel构建框架和GoogleTest框架进行全面的单元测试。

活动推荐

从上海到旧金山,2021 LiveVideoStackCon回归上海

2020年的LiveVideoStackCon受到COVID-19的影响,两次改期,并不得不改为线上大会。这样一算,今年4月即将举办的LiveVideoStackCon是时隔两年再次回归上海。

https://sh2021.livevideostack.com

解析腾讯云音视频通信三大核心网络技术实战与创新

得益于云计算、音视频、通信技术的发展,企业和开发者可以快速地将线下业务搬到线上,4月16日 | 上海,LiveVideoStack联合腾讯云共邀5位技术大咖,解析腾讯云构成全真互联网坚实基础的三大核心网络:多媒体分发网络、即时通信网络、实时音视频网络,以及边缘计算、低延时、编解码、WebRTC等技术的最新动向。

https://www.huodongxing.com/event/9589603136511

迈向视频内容时代的淘系技术

如此巨大的用户体量与需求必然对直播服务提出了更高的技术要求与挑战,4月17日|上海 ,LiveVideoStack携手淘系技术邀请4位阿里巴巴技术专家,共同梳理淘系直播电商的发展与技术演进之路,从编解码算法、全链路RTC传输网络出发,深度解析淘宝直播基础体验与互动能力实践,以及结合AI技术在视频内容理解的探索与应用。

https://www.huodongxing.com/event/7589315705011

小提示:链接跳转仅支持公众号相关链接

插图源自Pexels

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值