每周一期,纵览音视频技术领域的干货。
新闻投稿:contribute@livevideostack.com。
QoS和QoE初学者指南
本篇文章从宏观角度向大家介绍QoS和QoE。我会先从它们的定义开始,然后讨论它们之间的关联。接着,我们再来简单了解公司如何衡量和使用QoS和QoE。
视频修复:无监督流对齐的序列对序列学习方法S2SVR(ICML 2022)
本文将 Seq2Seq 的架构引入到了视频超分中,其次针对光流不准的问题,之前的文章选择使用DCN进行替代,本篇论文『Unsupervised Flow-Aligned Sequence-to-Sequence Learning for Video Restoration 』从另一个角度出发,通过知识蒸馏的方法来训练更准的光流,想法很好但是相比于DCN的效果还有待进一步的优化。
音视频开发之旅(十) GLSurfaceView源码解析&EGL环境
通过本篇的学习实践,了解GLSurfaceView内部是如何工作、了解EGThread的实现和EGL上下文的意义。在TextureView的基础上创建EGL上文和GLThread来实现OpenGL的绘制。
视频中的自定义面部表情分析
本文是对 Dominic Rüfenacht 的《Customized Facial Expression Analysis in Video》文章的介绍,主要围绕视频中的自定义面部表情分析,从当前研究现状、主要技术以及应用方面进行了介绍。
使用 VMAF 的改进版本进行视频质量评价
本文研究了基于 VMAF 的视频质量评估算法。作者将 VMAF 扩展到 NR 的情况下,使用一些不同的特征,以开发一个统一的 VQA 框架。在 VMAF 的基础上,作者使用了改进的运动特征和更好的回归器,使得其比 VMAF 的性能超出7-9%。
作业帮实时音视频ZRTC演进之路
作业帮实时音视频ZRTC经过流媒体技术团队的持续打磨和优化,已在大规模复杂的生产环境稳定运行3年以上,不仅有力地支持了作业帮丰富多彩的互动课程类型,同时也积累了丰富和宝贵的实践经验,今天我们一起来回顾并总结其中的关键技术要点。
如何基于 ZEGO SDK 实现 Android 一对一音视频聊天应用
疫情期间,很多线下活动转为线上举行,实时音视频的需求剧增,在视频会议,在线教育,电商购物等众多场景成了“生活新常态”。本文将教你如何通过即构ZEGO sdk在Android端搭建视频通话能力。
实时人脸识别系统
本文提出了一种用于直播的的人脸识别系统——人脸检测器。演讲首先介绍了人脸检测器及其用途,然后概述了系统的工作原理,如何与广播业务的其它设备相结合,最后展示了一些用例。
面试题 | 什么是秒开视频? 如何去秒开视频?
给大家带来一些音视频的面试题,或者说是一些开发思路吧,不希望它成为以后你面试的八股文。这次主要是视频秒开方面。秒开是指用户点击播放到看到画面的时间非常短,在 1 秒之内。