每周一期,纵览音视频技术领域的干货。
新闻投稿:contribute@livevideostack.com。
小提示:链接跳转仅支持公众号相关链接
低延迟流媒体协议SRT、WebRTC、LL-HLS、UDP、TCP、RTMP详解
Access Advance宣布已经完成VVC视频编码专利池的构建
https://www.iam-media.com/frandseps/vvc-access-advance-patent-pool
Per-Title编码的过去、现在和未来
https://www.streamingmedia.com/Articles/Editorial/Featured-Articles/The-Past-Present-and-Future-of-Per-Title-Encoding-147705.aspx
本文整理自火山引擎开发者社区 Meetup 第三期演讲,主要介绍了火山引擎点播端到端解决方案在零耗时首帧背后进行的相关技术优化。
WebRTC是一个非常复杂且庞大的东西,今天我们就对其中的发送方码率评估这一块做一个简单的实现解析,帮助大家更好的理解这部分内容。
本文将分享火山引擎 RTC 在互娱场景下的最佳实践,主要包括千人聊天、直播连麦和云渲染这三个具体场景。
本文来自OSA Publishing,由来自微软的研究科学家Sehoon Lim带来,主要介绍的是针对基于学习的图像修复任务进行孔径设计。
TIP2021—重访CV经典: 首个无监督深度学习图像拼接框架
图像拼接(Image Stitching)可以说是计算机视觉领域中一个非常经典且完备的体系,由于其包含如特征点检测、映射估计、匹配对齐、投影变换和图像融合等重要算法(其中每一个小点都可单独拿出来研究),如此综合全面的技术常常被选为各类毕业论文的研究课题。
https://zhuanlan.zhihu.com/p/386863945
GAN之再进化:分布判别器,大连理工提出一种新式无监督图像合成方法
在多人交互场景下的公开数据集例如:LibriCSS、AMI、CHiME都是基于英文语言,AISHELL-4的发布推动了智能语音技术在会议场景里中文多人交互技术的研究及落地。
Facebook升级3D AI仿真平台Habitat,号称速度达同类的50到100倍
Open 3D Engine
Open 3D Engine(O3DE) 是基于Apache 2.0 的多平台 3D 引擎,开发人员和内容创建者能够通过其构建 AAA 游戏、电影品质的 3D 世界和高保真模拟。
https://o3de.org/
Openpose+Tensorflow 这样实现人体姿态估计 | 代码干货
人体姿态估计指从单个 RGB 图像中精确地估计出人体的位置以及检测骨骼关键点的位置。人体姿态估计是计算机视觉领域的研究热点,是诸多计算机视觉任务的基础,如动作分类、异常行为检测、自动驾驶等。
阅读推荐
活动推荐
近年来,视频安防行业一直处于高速发展阶段,据预测,2021全国在视频安防领域新增摄像头数量在1.2亿台,已经全面进入大视频时代,视频资源在我国的安全、治理、交通、警务、城管、环保等领域发挥着越来越重要的作用。同时,随着我国智慧城市建设的高速推进,当下较低的视频资源利用水平与不断提高的数字城市业务需求间的矛盾也愈加突出。
7月15日 19:30,我们邀请到了 华为云视频接入服务产品经理 齐彦昆 结合在视频接入服务的实践经验,与大家一同探讨视频上云趋势、痛点、华为的解决方案及带来的好处。
【CoderPark】第二期 7月15日即将开启
Android12的核心变化是什么?Fish-Redux复杂场景的落地与演进以及Android SDK框架有什么亮点?谷歌、闲鱼、MobTech的专家将集聚一堂移动开发者们知悉行业趋势动向,探索新兴技术的应用场景及实践。
丰厚直播福利等你来抢:极客背包/鼠标垫/U型枕/《移动开发架构设计实战》
插图源自Pexels