音视频技术开发周刊（第127期）

最新推荐文章于 2021-11-25 14:51:28 发布

LiveVideoStack_

最新推荐文章于 2021-11-25 14:51:28 发布

阅读量1k

点赞数

本文链接：https://blog.csdn.net/vn9PLgZvnPs1522s82g/article/details/103856138

版权

每周一期，纵览音视频技术领域的干货和新闻投稿：contribute@livevideostack.com。

架构

SRS 3.0a7(3.0.90) is released.

SRS 3.0a7是Alpha版本，解决了一些bug，改善MP4、DASH可用性。

Kurento 6.13

现在可以更好地控制 ICE 协商机制。

零基础快速搭建K歌应用

本期腾讯云大学大咖分享课程邀请到腾讯云高级工程师，主要从三个方面说明如何搭建K歌应用：1.K歌功能应用场景和产品表现；2.K歌功能技术实现方案；3.K歌功能的开发实战。K歌的种类分为本地录制和在线歌房。

花椒前端基于WebAssembly 的H.265播放器研发

随着近些年直播技术的不断更新迭代，高画质、低带宽、低成本成为直播行业追求的重要目标之一，在这种背景下，H.264 标准已成为行业主流，而新一代的 HEVC（H.265）标准也正在直播领域被越来越广泛地采用。花椒直播一直在对 HEVC（H.265）进行研究、应用以及不断优化。

传输网络

使用go解析二进制TCP数据包

TCP全名是传输控制协议，TCP协议在ip协议基础上增加了数据包完整性检查等保证传输完整性的机制，使其在现在的数据领域得到了广泛的应用,按照文中的步骤可以快速了解tcp数据包中包含的信息。

不要将 WebRTC 流推给 HLS，也许你尝试了这些方法

并非每个 H.264 流都是同等权重的。

编解码

如何使用下一代编码技术提升流媒体体验

本文来自Bitmovin总裁及联合创始人Stefan Lederer LiveVideoStackCon2019北京大会上的分享。Stefan介绍了下一代编解码器和编码技术的实施，以及如何让观众有更好的流媒体和视频体验。另外，还进一步解释HEVC、VP9和AV1如何在不同的设备上运作。如果将这些编解码器结合，可以降低比特率获取更大的存储空间，把CDN成本降低30%。

基于深度神经网络的帧重建以优化视频编码

本文是来自AOMedia Symposium 2019的演讲，讲者是来自于杭州师范大学的Dandan Ding。本次演讲以AV1为例，主要讲述了使用神经网络做环内滤波的两个问题，即如何设计网络结构和如何嵌入网络。

视频技术

2019年多媒体技术圈年终事件大回顾

广阔天地，大有可为。祝愿各位同行们在新的时代大潮中乘风破浪，勇攀高峰。

图像视频降噪的现在与未来——从经典方法到深度学习

噪声是图像与视频中的一种常见失真类型，也是腾讯多媒体实验室以及腾讯云提供的多种失真处理能力之一。本分享总结了噪声产生的几个原因，从理论上分析降噪的基本原理，并介绍了使用传统方法和深度学习进行单帧降噪、多帧降噪和视频降噪的技术。

Pixel 4 更新！更好的视频通话及日益完善的人脸解锁

AI 加持 Google Duo 的视频通话。

iOS基于AVPlayer实现音视频播放和缓存

AudioToolbox是较底层的音视频处理库，一般专业的音视频播放器和编辑器都会基于这个库进行开发，例如这个AudioKit。AVFoundation是更上一层的封装好的库，一般常规的音视频播放需求都会使用这个库进行开发，本文要讲的AVPlayer就属于AVFoundation。

使用 Asterisk 的 SFU 进行屏幕共享

Dan 继续涉足 Asterisk。

来自 Airtime 的目标视频质量分析

一个很好的视频质量分析概述。

Demuxed 2019 演讲视频选

码率控制模型CRF和视频分辨率之间的关系/quiche支持的QUIC和HTTP/3协议/AV1 Image File Format(AVIF)

第一场演讲的演讲者是来自Twitter的Sebastian Van Leuven，演讲内容是码率控制模型CRF和视频分辨率之间的关系。演讲者首先讲述了Libx264码率控制的一些模型，比如CBR，ABR，CRF和VBV，然后阐述了他们研究CRF和分辨率对码率影响的方法，接着以曲线图的形式给出了CRF和分辨率对码率的影响，最后总结出了四点结论。
第二场演讲的演讲者是来自Cloudflare的Lucas Pardue,演讲内容是由quiche支持的QUIC和HTTP/3协议。quiche是Cloudflare开发的一款软件，用以支持curl和nginx上的QUIC和HTTP/3协议。演讲者首先展示了quiche的源码和文档示例，最后分别给出了quiche在Curl和nginx上的安装和使用方法示例。
第三场演讲的演讲者是来自Netflix的Cyril Concolato,演讲者首先简要介绍了AV1图像格式AVIF，然后讲述了AVIF的性能，包括位宽，颜色空间，HDR等，接着演讲者给出了AVIF支持HDR图像的示例。然后，演讲者研究了几种格式对低分辨率图像（571x800）的压缩性能，结果AVIF的性能要优于HEVC，JEPG 2000和WebP。此外，演讲者也比较了各种图像格式的编码时间和解码时间，从结果来看AVIF的性能表现相当好。最后，演讲者介绍了一些AVIF的读写工具。

AI智能

微信「扫一扫识物」的背后技术揭秘

微信扫码已经深入人心，微信扫物 12.23 日 ios 版本正式上线，从识别特定编码形态的图片(二维码/小程序码/条形码/扫翻译)，到精准识别自然场景中商品图片(鞋子/箱包/美妆/服装/家电/玩具/图书/食品/珠宝/家具/其他商品)，有哪些难点需要去克服? 扫物以图片(视频)作为媒介，聚合微信内部有价值的生态内容如电商，百科，资讯进行展示，会催生哪些新的落地场景?本文将细细道来.

视频机器学习解密

本文是来自Streaming Media West 2019的演讲，讲者Jun Heider是RealEyes Media的首席技术官。本次演主要讲述了视频机器学习以及相关工具的使用。

图像

“撸猫神器”StarGAN v2

最新的神奇变脸工具StarGAN第二版来了！这次不仅可以人变人，还能实现猫、狗、虎、豹各种动物无缝切换，输入图片给进去，想变什么自己挑！数据集和Github资源已开放。

资源推荐

StarGAN v2

多样化的图像合成为多个域

点击“阅读原文”可查看更多详细信息，请大家科学上网。