音视频开发进阶课程
文章平均质量分 94
ZEGO即构
全球实时音视频云服务商
展开
-
音视频进阶(五):实现直播场景的美颜滤镜
ZEGO音视频SDK提供了强大的基础美颜功能,旨在为用户呈现出优美、自然的肌肤状态,从而创造独特而引人注目的美颜效果。这一功能广泛应用于视频通话、直播等场景,为用户在实时音视频交流中提供更加令人愉悦的外观体验。开发者可以开启美颜开关,然后根据需要调整美白、磨皮、锐化以及红润的程度,轻松实现基础美颜功能。原创 2023-12-31 22:18:01 · 947 阅读 · 0 评论 -
即时通讯实践(一):IM SDK 轻松实现小程序多人聊天室
ZIM SDK 提供多人房间聊天功能,支持用户向房间内发送文本消息或自定义消息,实现了多人在线交流、同步分享。多人房间聊天功能可应用于小班课或者会议室等场景原创 2023-12-30 20:55:58 · 1089 阅读 · 0 评论 -
音视频进阶(三):实现直播间的自定义视频渲染
在实时音视频应用开发中,自定义视频渲染技术扮演着至关重要的角色。通过自定义视频渲染,开发者能够将即构实时音视频SDK采集的视频数据与应用的界面或游戏引擎进行无缝集成,实现定制化的用户体验。本文将为您介绍如何使用即构实时音视频SDK的自定义视频渲染功能,以及如何在您的应用中实现对视频帧数据的特殊处理。原创 2023-12-14 20:42:48 · 799 阅读 · 0 评论 -
音视频进阶(二):如何实现游戏场景下的范围语音
在本文中,我们将介绍如何实现游戏场景下的范围语音功能。范围语音功能允许玩家根据角色在游戏世界中的位置和朝向,在特定范围内进行语音交流。例如,当玩家距离另一个玩家较近时,可以听到对方的语音,而当距离较远时,则听不到。通过这种方式,游戏中的实时语音交流将更加真实和 immersive。原创 2023-12-12 19:04:36 · 925 阅读 · 0 评论 -
音视频进阶(一):直播间如何使用SEI实现音画内容精准同步
在音视频流媒体应用中,除了可以流媒体通道推拉音视频内容外,还可以使用流 SEI(Supplemental Enhancement Information,媒体补充增强信息)通过流媒体通道将文本信息与音视频内容打包在一起,从主播端(推流端)推出,并从观众端(拉流端)接收,以此实现文本数据与音视频内容的精准同步的目的。 一般可用于视频画面的精准布局、远端歌词同步、直播答题等应用场景。原创 2023-12-12 18:40:35 · 1070 阅读 · 0 评论 -
WebRTC概述|QOS技术如何提升音视频通话质量
WebRTC 通过一系列的QOS 技术来提升音视频通话质量: 抗丢包策略(NACK、 FEC), 拥塞控制策略(TWCC/REMB), SVC或多视轨, 视频质量自适应策略, Pacer、JitterBuffer等.原创 2023-12-11 11:17:16 · 1656 阅读 · 0 评论 -
ZEGO 即构音乐场景降噪技术解析
随着线上泛娱乐的兴起,语聊房、在线 KTV 以及直播等场景在人们的日常生活中占据越来越重要的地位,用户对于音质的要求也越来越高,因此超越传统语音降噪算法的 AI 降噪算法应运而生,所以目前各大 RTC 厂商普遍使用 AI 技术进行降噪处理,使用 AI 降噪技术消除除人声外的一切声音。若检测出音乐场景则会使用传统降噪对音频数据进行处理,以减少对音乐的损伤,非音乐场景则继续使用 AI 降噪进行更深度的噪声消除。,能在音乐与非音乐场景中智能切换,既保证了无音乐场景下的语音的质量,又保留了音乐的高保真音质。原创 2023-06-21 14:10:53 · 263 阅读 · 0 评论 -
音视频开发进阶|第六讲:色彩和色彩空间·下篇
如果使用错误的 Stride = 7,正确的 Width = 6,会出现如下问题:从第一行开始,少读取了一块 Padding,并将这部分少读取的 Padding ,误当作第二行的 “有效图像” 进行读取、排列。需要补充的是,图像位深 24bit 、通道位深 8bit 是比较标准的位深配置,大家可能还会接触到诸如 32bit、16bit、8bit 等图像位深,它们并不是 3 的倍数,无法平摊到 RGB 或者 YUV 的三个通道上。音频采样位深,指的是用多大的字节空间来存储声音的量化值。原创 2022-11-08 13:04:19 · 1091 阅读 · 0 评论 -
元宇宙场景技术实践|实现“虚拟人”自由
ZEGO Avatar SDK 提供了手动捏脸功能,支持用户根据自己的审美偏好,对虚拟人物形象脸部的各个部位进行细微调节(如眼睛大小、鼻子宽窄、嘴巴大小等),融合成自定义的虚拟人物形象人脸,自由定义,打造独一无二的专属形象,可广泛应用于各类游戏场景中。ZEGO Avatar SDK 提供了AI 捏脸功能,支持通过“摄像头”或者“上传图像”的方式,结合对人脸进行海量分析和训练后的 AI 算法,识别人脸特征,再以美术设计提供的虚拟形象人模为基础,生成与真人高度还原的虚拟形象。,通过前置摄像头,开始检测表情;原创 2022-11-08 11:31:25 · 1396 阅读 · 0 评论 -
音视频开发进阶——YUV与RGB的采样与存储格式
关于 YUV 的采样格式我们就先了解到这里,确定采样格式对于正确处理 YUV 图像是至关重要的,如果采样格式判定错误,会读取到异常的图像。如下,为基于 YUV444 采样格式读取 YUV420 格式图片的一种异常效果:左一:原图,YUV420;左二:基于 YUV444 读取YUV420。原创 2022-10-19 11:20:51 · 1882 阅读 · 0 评论 -
视频产生的本质及色彩空间:RGB 和 YUV
了解视频、图像、像素和色彩之间的关系,初步认识两种重要的色彩空间:RGB 和 YUV,以及它们的基本原理、差异和联系。原创 2022-09-02 11:05:41 · 2598 阅读 · 0 评论 -
多路混流实操流程
混流是把多路音视频流从云端混合成单流的技术。原创 2022-08-26 16:46:12 · 421 阅读 · 0 评论 -
快速实现 CDN 直播
ZEGO Express SDK 支持推流到 CDN(Content Delivery Network,内容分发网络),包括转推 CDN 和直推 CDN 两种功能。开发者基于该功能可打通 RTC 产品和 CDN 直播产品,方便用户从网页或第三方播放器直接观看和收听直播内容。为了保证安全,推流到 CDN 时默认开启 CDN 鉴权。为防止攻击者盗取或伪造您的推流 URL 地址,您可以参考。...原创 2022-08-12 14:05:59 · 1021 阅读 · 0 评论 -
音视频开发进阶|音频编解码的必要性解读与格式选取
在上一篇文章中,我们完成了对音频前处理三剑客的学习。声音信号经过音频前处理模块,已经“洗尽铅华、去除杂质”,现在,你是否已迫不及待想要将它们分享到世界各地了呢?但稍安勿躁,想要更好地与世界分享我们的声音,还有一个不得不考虑的问题,而这个问题将由我们今天的主角 “音频编解码”来解决。我们都知道,要想把音视频数据实时分享到世界的各个角落,有一个传输工具必不可少:网络。而要用好这个传输工具,有一个必须关注的点:网络带宽。作为资深网民,大家肯定都了解过带宽。它指的是网络链路1秒钟内能传输的最大数据量,其单位一般使用原创 2022-08-12 10:59:44 · 953 阅读 · 0 评论 -
音频自动增益控制 AGC 解决的问题及原理解析
什么是“音量”?音量“增益”的本质是什么?AGC 进行音量增益“自动控制”的策略是什么?原创 2022-07-19 11:24:56 · 8169 阅读 · 0 评论 -
音视频基础知识|ANS 噪声抑制原理解析
噪声问题和回声问题一样,严重影响音视频场景下的用户体验,是所有开发者绕不开的槛。原创 2022-06-17 11:15:27 · 4698 阅读 · 1 评论 -
音视频处理三剑客之 AEC:回声产生原因及回声消除原理
AEC:回声产生原因及回声消除原理解析!原创 2022-06-10 11:19:30 · 4656 阅读 · 2 评论 -
音视频开发基础入门|声音的采集与量化、音频数字信号质量、音频码率
栏目介绍:为了帮助开发者更好的理解音视频概念,进行音视频应用开发,ZEGO 即构科技联合内部音视频开发专家打磨了本套《音视频开发进阶》课程,帮助大家轻松入门并可以自己动手开发音视频 App!本次课程为系列内容,课程将从音视频基础概念讲解展开,进行学习内容的难度进阶,后期将带领大家学习有关音视频开发的各种疑难问题,以及如何利用 SDK 开发音视频应用!内容定期更新推送,请持续关注!前言“风声,雨声,读书声,声声入耳”,关于声音,大家肯定都不陌生。作为最基础的信息载体之一,声音被用于社交沟通原创 2022-05-20 10:50:13 · 6539 阅读 · 0 评论