音视频技术开发周刊 | 194

每周一期,纵览音视频技术领域的干货。

新闻投稿:contribute@livevideostack.com。

小提示:链接跳转仅支持公众号相关链接

进入全真互联网——音视频通信的技术变革

随着5G和下一代编解码、传输等技术持续演进,音视频通话技术从低延时到超低延时实时通信快速迭代,越来越多应用与服务迁移至线上,越来越真实无损地还原线下体验,新的互动方式和场景不断涌现,从高度数字化到拟真化再到全真互联网时代。本次LiveVideoStackCon 2021上海站我们邀请到了腾讯云副总裁李郁韬来分享音视频的变革趋势、演进以及未来。

边缘计算不“边缘”——助攻视频行业这几年

随着边缘计算行业的不断发展,其业务也越来越广泛,越来越成熟。边缘计算的发展历程并不是一帆风顺,其运用起来也和传统云计算有很大不同。那么边缘计算行业所面对的挑战以及未来的发展是什么样的呢?有请网心科技的李浩为我们分享他助攻视频行业的这几年。

实时音视频技术的演进与应用

本次分享我们邀请到了来自腾讯云实时音视频TRTC后台的研发负责人薛笛,他向我们分享了腾讯云TRTC在架构升级和产品实践中的经验。仔细讲解了混音引擎最初的制造源、在整个优化过程中发现的问题以及解决方法,为后来做腾讯会议和云呼叫中心打下了一个良好的基础。


流媒体的安全

本文来自Streaming Video Alliance,在本网络研讨会中,我们将探讨许多可用于阻止直播盗版的技术,以及视频发行商可以用来帮助尽可能减少盗版的一些做法。

谈谈 WebRTC 的 SDP Unified Plan

今年2月份,webrtc M89 的正式发布,在Release note 提出了一个重要更新,即废弃webrtc Plan B SDP 语义,推荐使用标准SDP格式:Unified Plan。WebRTC1.0 已经正式成为 W3C 标准,主流浏览器基本都支持UnifiedPlan SDP。

WebRTC如何驱动亚秒级广播和游戏直播流

本次演讲来自Demuxed 2020,主讲人是来自苹果公司开发人员Sean dubios,他还是Pion WebRTC的创建者。演讲主题是WebRTC如何驱动亚秒级广播和游戏直播流。

MediaStreamTrack 的可插入流

从现在开始,WebRTC 会有更多的虚拟背景和有趣的面具功能加入。

https://web.dev/mediastreamtrack-insertable-media-processing/

Visionular AV1编码器针对所有用例进行了优化

得益于AOMedia资助的dav1d项目,Visionular确定了AV1可行的用户方案,可以在其中利用软件解码解决方案,这已成为标准和Visionular解决方案发展的重要基础。

http://aomedia.org/av1%20adoption/visionular-av1-encoder-optimized/

浅析 XR 关键技术

扩展现实(XR)实际是一个概括性术语,囊括了增强现实(AR),虚拟现实(VR),混合现实(MR)以及介于他们之间的所有内容。

AR中面部追踪的基础浅析

在AR中实现追踪并不是一件易事,一方面需要拥有更为强大的传感器,另一方面还需要设备有足够的算力。

DeepBlur:一种简单有效的自然图像模糊方法

现有的图像模糊技术要么容易受到人类或深度学习模型的再识别攻击,要么在保持图像保真度方面不够,要么计算量太大,难以实现。为了解决这些问题,我们提出了DeepBlur,这是一种简单而有效的图像模糊方法,它通过无条件预先训练的生成模型的潜在空间进行模糊处理,该模型能够合成逼真的人脸图像。

输入两张“怪异”图像,VGG、Inception、ResNet集体翻车,经典图像分类模型有多脆弱?

如果我们对图像进行一些非常规操作,比如把猪放在它“不熟悉”的天空环境中,或者把局部目标异常放大,它们还能准确分类吗?

Telegram 下个月添加群组视频通话功能

有无使用 WebRTC?是否支持浏览器?据悉,群组视频通话将在下个月出现在Telegram的消息平台上,并被吹捧为一个功能齐全的实现,包括支持基于Web的视频会议。

https://techcrunch.com/2021/04/28/telegram-to-add-group-video-calls-next-month/?utm_source=feedburner&utm_medium=feed&utm_campaign=Feed%3A+Techcrunch+%28TechCrunch%29

VLC发布3.0.13版本

此次更新包括2处更改,41个添加项和3个删除项。在多路分配器、编解码器、使用权、视频输出、接口等方面都做了相应的更新或修复调整。

https://code.videolan.org/videolan/vlc-3.0/-/blob/master/NEWS

Safari 14.1 的 Webkit 新功能

WebKit中的Web Speech API支持语音合成已有一段时间了。现在,Safari支持与Siri相同的语音引擎支持的语音识别。这意味着Web开发人员可以享受50多种语言和方言的高质量转录。

https://webkit.org/blog/11648/new-webkit-features-in-safari-14-1/

插图源自Pexels

The cover from creativeboom.com

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值