每周一期,纵览音视频技术领域的干货和新闻投稿:contribute@livevideostack.com。
架构
SRS 3.0a7(3.0.90) is released.
SRS 3.0a7是Alpha版本,解决了一些bug,改善MP4、DASH可用性。
Kurento 6.13
现在可以更好地控制 ICE 协商机制。
零基础快速搭建K歌应用
本期腾讯云大学大咖分享课程邀请到腾讯云高级工程师,主要从三个方面说明如何搭建K歌应用:1.K歌功能应用场景和产品表现;2.K歌功能技术实现方案;3.K歌功能的开发实战。K歌的种类分为本地录制和在线歌房。
花椒前端基于WebAssembly 的H.265播放器研发
随着近些年直播技术的不断更新迭代,高画质、低带宽、低成本成为直播行业追求的重要目标之一,在这种背景下,H.264 标准已成为行业主流,而新一代的 HEVC(H.265)标准也正在直播领域被越来越广泛地采用。花椒直播一直在对 HEVC(H.265)进行研究、应用以及不断优化。
传输网络
使用go解析二进制TCP数据包
TCP全名是传输控制协议,TCP协议在ip协议基础上增加了数据包完整性检查等保证传输完整性的机制,使其在现在的数据领域得到了广泛的应用,按照文中的步骤可以快速了解tcp数据包中包含的信息。
不要将 WebRTC 流推给 HLS,也许你尝试了这些方法
并非每个 H.264 流都是同等权重的。
编解码
如何使用下一代编码技术提升流媒体体验
本文来自Bitmovin总裁及联合创始人Stefan Lederer LiveVideoStackCon2019北京大会上的分享。Stefan介绍了下一代编解码器和编码技术的实施,以及如何让观众有更好的流媒体和视频体验。另外,还进一步解释HEVC、VP9和AV1如何在不同的设备上运作。如果将这些编解码器结合,可以降低比特率获取更大的存储空间,把CDN成本降低30%。
基于深度神经网络的帧重建以优化视频编码
本文是来自AOMedia Symposium 2019的演讲,讲者是来自于杭州师范大学的Dandan Ding。本次演讲以AV1为例,主要讲述了使用神经网络做环内滤波的两个问题,即如何设计网络结构和如何嵌入网络。
视频技术
2019年多媒体技术圈年终事件大回顾
广阔天地,大有可为。祝愿各位同行们在新的时代大潮中乘风破浪,勇攀高峰。
图像视频降噪的现在与未来——从经典方法到深度学习
噪声是图像与视频中的一种常见失真类型,也是腾讯多媒体实验室以及腾讯云提供的多种失真处理能力之一。本分享总结了噪声产生的几个原因,从理论上分析降噪的基本原理,并介绍了使用传统方法和深度学习进行单帧降噪、多帧降噪和视频降噪的技术。
Pixel 4 更新!更好的视频通话及日益完善的人脸解锁
AI 加持 Google Duo 的视频通话。
iOS基于AVPlayer实现音视频播放和缓存
AudioToolbox是较底层的音视频处理库,一般专业的音视频播放器和编辑器都会基于这个库进行开发,例如这个AudioKit。AVFoundation是更上一层的封装好的库,一般常规的音视频播放需求都会使用这个库进行开发,本文要讲的AVPlayer就属于AVFoundation。
使用 Asterisk 的 SFU 进行屏幕共享
Dan 继续涉足 Asterisk。
来自 Airtime 的目标视频质量分析
一个很好的视频质量分析概述。
Demuxed 2019 演讲视频选
码率控制模型CRF和视频分辨率之间的关系/quiche支持的QUIC和HTTP/3协议/AV1 Image File Format(AVIF)
第一场演讲的演讲者是来自Twitter的Sebastian Van Leuven,演讲内容是码率控制模型CRF和视频分辨率之间的关系。演讲者首先讲述了Libx264码率控制的一些模型,比如CBR,ABR,CRF和VBV,然后阐述了他们研究CRF和分辨率对码率影响的方法,接着以曲线图的形式给出了CRF和分辨率对码率的影响,最后总结出了四点结论。
第二场演讲的演讲者是来自Cloudflare的Lucas Pardue,演讲内容是由quiche支持的QUIC和HTTP/3协议。quiche是Cloudflare开发的一款软件,用以支持curl和nginx上的QUIC和HTTP/3协议。演讲者首先展示了quiche的源码和文档示例,最后分别给出了quiche在Curl和nginx上的安装和使用方法示例。
第三场演讲的演讲者是来自Netflix的Cyril Concolato,演讲者首先简要介绍了AV1图像格式AVIF,然后讲述了AVIF的性能,包括位宽,颜色空间,HDR等,接着演讲者给出了AVIF支持HDR图像的示例。然后,演讲者研究了几种格式对低分辨率图像(571x800)的压缩性能,结果AVIF的性能要优于HEVC,JEPG 2000和WebP。此外,演讲者也比较了各种图像格式的编码时间和解码时间,从结果来看AVIF的性能表现相当好。最后,演讲者介绍了一些AVIF的读写工具。
AI智能
微信「扫一扫识物」 的背后技术揭秘
微信扫码已经深入人心, 微信扫物 12.23 日 ios 版本正式上线,从识别特定编码形态的图片(二维码/小程序码/条形码/扫翻译),到精准识别自然场景中商品图片(鞋子/箱包/美妆/服装/家电/玩具/图书/食品/珠宝/家具/其他商品),有哪些难点需要去克服? 扫物以图片(视频)作为媒介,聚合微信内部有价值的生态内容如电商,百科,资讯进行展示, 会催生哪些新的落地场景?本文将细细道来.
视频机器学习解密
本文是来自Streaming Media West 2019的演讲,讲者Jun Heider是RealEyes Media的首席技术官。本次演主要讲述了视频机器学习以及相关工具的使用。
图像
“撸猫神器”StarGAN v2
最新的神奇变脸工具StarGAN第二版来了!这次不仅可以人变人,还能实现猫、狗、虎、豹各种动物无缝切换,输入图片给进去,想变什么自己挑!数据集和Github资源已开放。
资源推荐
StarGAN v2
多样化的图像合成为多个域
点击“阅读原文”可查看更多详细信息,请大家科学上网。