『音视频技术开发周刊』由LiveVideoStack团队出品,专注在音视频技术领域,纵览相关技术领域的干货和新闻投稿,每周一期。点击『阅读原文』,浏览第84期内容,祝您阅读愉快。
架构
手机K歌的人声伴奏对齐优化实践
人类大脑对声音的响应速度和敏感程度非常高。K歌时对人声音轨和伴奏音轨的时间对齐有很强的要求。唱吧资深研发总监 王国腾在LiveVideoStackCon2018大会的分享中详细介绍了手机K歌在混音对齐方面存在的问题,解决方案以及值得探索的方向。LiveVideoStack对演讲内容进行整理。
沃尔玛计划放弃视频流媒体服务,转而专注于Vudu
沃尔玛曾希望通过流媒体视频服务与亚马逊(Amazon)、苹果(Apple)等竞争,但据报道,沃尔玛现在放弃了这些计划,转而专注于目前的VOD服务Vudu。
直播开发过程中关于直播技术的架构问题
在直播开发过程中,需要关注的点有很多。但是我们并不能把关注点只是放在客户端如何去采集音频数据,或者是客户端的推拉流的相关内容,而是应该先了解一下直播技术的架构问题。这样一来,对于直播技术的运转流程理解起来也就更加容易了。
传输网络
TCP的困境与解决方案
TCP协议是互联网应用最广泛的数据传输协议之一,在过去的40年中改变了世界,但也成为了新的技术瓶颈。Cascade Range Networks, Inc CTO/联合创始人 范醒哲在LiveVideoStack线上交流分享中详细解析了TCP面临的困境与可行的解决方案。本文由LiveVideoStack整理而成。
基于爱奇艺HCDN视频分发网络的开放缓存
为通过Internet向海量用户传输高清晰度、高码率的视频节目,爱奇艺融合CDN和P2P技术,开发出一套适合多终端的混合分发传输网络——HCDN。本文来自爱奇艺高级技术总监庹虎在LiveVideoStackCon 2018大会中的演讲,由LiveVideoStack整理而成。
Webex 如何在在线会议领域保持优势?
在实时通讯的所有的细分领域中,在线会议领域的竞争尤为激烈。Webex如何在此领域中保持优势?本文来自ZK Research创始人兼首席分析师 Zeus Kerravala,LiveVideoStack进行了翻译。
音频/视频技术
Android音频开发之MediaPlayer
Android 提供了常见的音频、视频的编码、解码机制。借助于多媒体类 MediaPlayer 的支持,开发人员可以很方便地在应用中播放音频、视频。只不过使用 MediaPlayer 播放视频时,没有提供图像输出界面。
音视频技术:视频质量评价方法简介
视频质量评估(VQA)一直是个很活跃的研究领域,原因其一是业内一直缺少一种统一且准确的评估标准,其二是影响视频质量的因素过多,且包含很多主观因素,难以客观、定量地评价。经过这么多年的研究,已经诞生了非常多的视频质量评估方法,本文将简单地对它们进行分类及介绍。
Puffer:专注拥塞控制、带宽预测和ABR
斯坦福大学研究小组发布了一项新的开源研究项目Puffer,该项目致力于通过人工智能改进互联网传输与视频流算法。点击【阅读原文】访问Puffer官网。
基于音视频通信RTC实现音视频通话
音视频通信RTC产品 由多平台SDK + 安全可靠,稳定低延时的传输网络构成,为用户提供基础通用的实时音视频通信服务,用户可以基于RTC快速搭建各种实时通信场景化产品,譬如在线音视频会议,1对1通话等,本文主要介绍如何基于RTC实现音视频通话。
浅谈车载音响DSP功放
现在主流的车载音响系统都是用带有DSP功能的功放,这是因为数字信号处理技术可以有效的解决声音重放系统在汽车这个极端恶劣的声学环境下遇到的种种问题。
编解码
ffplay源码分析4-音视频同步
ffplay是FFmpeg工程自带的简单播放器,使用FFmpeg提供的解码器和SDL库进行视频播放。本文基于FFmpeg工程4.1版本进行分析。
RTMP推流H264+AAC
本文主要讲述如何使用开源的rtmp库来搭建一个rtmp client,推送H264和AAC流到rtmp server。笔者基于两套开源的项目进行了测试:rtmpdump以及srslibrtmp(这个是国人在rtmpdump基础上优化改进扩展的rtmp项目)。
BlackBerry通过Velos Media获得HEVC专利授权
Velos Media宣布,黑莓已经加入该平台,并将通过Velos Media获得HEVC专利的授权。
《Android FFmpeg 播放器开发梳理》第二章 音视解码器和视频解码器实现
MediaDecoder基类主要封装一些基本的数据,比如媒体流、媒体流索引、待解码的数据包队列以及获取数据包队列的内存大小、队列缓冲的时长等数据。
基于NVIDIA TEGRA系列板卡的硬件解码及视频推流
以NVIDIA TX1为例硬解码就是利用硬件芯片来解码的,TX1有单独的解码模块,NVDEC。
AI智能
基于FPGA的深度学习加速器综述:挑战与机遇
FPGA 的神经网络加速器如今越来越受到 AI 社区的关注,本文对基于 FPGA 的深度学习加速器存在的机遇与挑战进行了概述。
YouTube深度学习推荐系统的十大工程问题
文章主要介绍了YouTube深度学习系统论文中的十个工程问题,为了方便进行问题定位,我们还是简单介绍一下背景知识,简单回顾一下 Deep Neural Networks for YouTube Recommendations 中介绍的YouTube深度学习推荐系统的框架。
深度卷积神经网络架构最新进展综述
近几年的AI发展潮流势不可挡,其中深度学习算法功不可没,巨大的应用价值也造就了这一领域的快速发展速度,相关论文层出不穷,今天为大家推荐一篇最新的综述文章,介绍了深度卷积神经网络(CNN)框架的一些最新研究进展。
图像
Adobe放出P图新研究:就算丢了半个头,也能逼真复原
通用式三维即时成像技术
采用基于双目视觉测量技术中的被动式纯光学成像的技术,是最符合“机器眼”三维成像目标要求的技术。单纯使用双目匹配算法实现三维立体图像计算,目前广泛应用在航测领域,但该方法在计算三维时,需要人工干预,且大都采用后期处理的方式,难以采用一套程序自动完成。