ZEGO即构科技

音视频技术干货的分享聚集地，更多信息请关注公众号(zego_tech_b)。

音视频开发进阶课程

关注

文章平均质量分 94

关注数：文章数：18 文章阅读量：40141 文章收藏量：533

作者: ZEGO即构

全球实时音视频云服务商

展开

音视频进阶(五)：实现直播场景的美颜滤镜

ZEGO音视频SDK提供了强大的基础美颜功能，旨在为用户呈现出优美、自然的肌肤状态，从而创造独特而引人注目的美颜效果。这一功能广泛应用于视频通话、直播等场景，为用户在实时音视频交流中提供更加令人愉悦的外观体验。开发者可以开启美颜开关，然后根据需要调整美白、磨皮、锐化以及红润的程度，轻松实现基础美颜功能。

原创 2023-12-31 22:18:01 · 947 阅读 · 0 评论
即时通讯实践(一)：IM SDK 轻松实现小程序多人聊天室

ZIM SDK 提供多人房间聊天功能，支持用户向房间内发送文本消息或自定义消息，实现了多人在线交流、同步分享。多人房间聊天功能可应用于小班课或者会议室等场景

原创 2023-12-30 20:55:58 · 1089 阅读 · 0 评论
音视频进阶(三)：实现直播间的自定义视频渲染

在实时音视频应用开发中，自定义视频渲染技术扮演着至关重要的角色。通过自定义视频渲染，开发者能够将即构实时音视频SDK采集的视频数据与应用的界面或游戏引擎进行无缝集成，实现定制化的用户体验。本文将为您介绍如何使用即构实时音视频SDK的自定义视频渲染功能，以及如何在您的应用中实现对视频帧数据的特殊处理。

原创 2023-12-14 20:42:48 · 799 阅读 · 0 评论
音视频进阶(二)：如何实现游戏场景下的范围语音

在本文中，我们将介绍如何实现游戏场景下的范围语音功能。范围语音功能允许玩家根据角色在游戏世界中的位置和朝向，在特定范围内进行语音交流。例如，当玩家距离另一个玩家较近时，可以听到对方的语音，而当距离较远时，则听不到。通过这种方式，游戏中的实时语音交流将更加真实和 immersive。

原创 2023-12-12 19:04:36 · 925 阅读 · 0 评论
音视频进阶(一)：直播间如何使用SEI实现音画内容精准同步

在音视频流媒体应用中，除了可以流媒体通道推拉音视频内容外，还可以使用流 SEI（Supplemental Enhancement Information，媒体补充增强信息）通过流媒体通道将文本信息与音视频内容打包在一起，从主播端（推流端）推出，并从观众端（拉流端）接收，以此实现文本数据与音视频内容的精准同步的目的。一般可用于视频画面的精准布局、远端歌词同步、直播答题等应用场景。

原创 2023-12-12 18:40:35 · 1070 阅读 · 0 评论
WebRTC概述｜QOS技术如何提升音视频通话质量

WebRTC 通过一系列的QOS 技术来提升音视频通话质量: 抗丢包策略(NACK、 FEC), 拥塞控制策略(TWCC/REMB), SVC或多视轨, 视频质量自适应策略， Pacer、JitterBuffer等.

原创 2023-12-11 11:17:16 · 1656 阅读 · 0 评论
ZEGO 即构音乐场景降噪技术解析

随着线上泛娱乐的兴起，语聊房、在线 KTV 以及直播等场景在人们的日常生活中占据越来越重要的地位，用户对于音质的要求也越来越高，因此超越传统语音降噪算法的 AI 降噪算法应运而生，所以目前各大 RTC 厂商普遍使用 AI 技术进行降噪处理，使用 AI 降噪技术消除除人声外的一切声音。若检测出音乐场景则会使用传统降噪对音频数据进行处理，以减少对音乐的损伤，非音乐场景则继续使用 AI 降噪进行更深度的噪声消除。，能在音乐与非音乐场景中智能切换，既保证了无音乐场景下的语音的质量，又保留了音乐的高保真音质。

原创 2023-06-21 14:10:53 · 263 阅读 · 0 评论
音视频开发进阶｜第六讲：色彩和色彩空间·下篇

如果使用错误的 Stride = 7，正确的 Width = 6，会出现如下问题：从第一行开始，少读取了一块 Padding，并将这部分少读取的 Padding ，误当作第二行的 “有效图像” 进行读取、排列。需要补充的是，图像位深 24bit 、通道位深 8bit 是比较标准的位深配置，大家可能还会接触到诸如 32bit、16bit、8bit 等图像位深，它们并不是 3 的倍数，无法平摊到 RGB 或者 YUV 的三个通道上。音频采样位深，指的是用多大的字节空间来存储声音的量化值。

原创 2022-11-08 13:04:19 · 1091 阅读 · 0 评论
元宇宙场景技术实践｜实现“虚拟人”自由

ZEGO Avatar SDK 提供了手动捏脸功能，支持用户根据自己的审美偏好，对虚拟人物形象脸部的各个部位进行细微调节（如眼睛大小、鼻子宽窄、嘴巴大小等），融合成自定义的虚拟人物形象人脸，自由定义，打造独一无二的专属形象，可广泛应用于各类游戏场景中。ZEGO Avatar SDK 提供了AI 捏脸功能，支持通过“摄像头”或者“上传图像”的方式，结合对人脸进行海量分析和训练后的 AI 算法，识别人脸特征，再以美术设计提供的虚拟形象人模为基础，生成与真人高度还原的虚拟形象。，通过前置摄像头，开始检测表情；

原创 2022-11-08 11:31:25 · 1396 阅读 · 0 评论
音视频开发进阶——YUV与RGB的采样与存储格式

关于 YUV 的采样格式我们就先了解到这里，确定采样格式对于正确处理 YUV 图像是至关重要的，如果采样格式判定错误，会读取到异常的图像。如下，为基于 YUV444 采样格式读取 YUV420 格式图片的一种异常效果：左一：原图，YUV420；左二：基于 YUV444 读取YUV420。

原创 2022-10-19 11:20:51 · 1882 阅读 · 0 评论
视频产生的本质及色彩空间：RGB 和 YUV

了解视频、图像、像素和色彩之间的关系，初步认识两种重要的色彩空间：RGB 和 YUV，以及它们的基本原理、差异和联系。

原创 2022-09-02 11:05:41 · 2598 阅读 · 0 评论
多路混流实操流程

混流是把多路音视频流从云端混合成单流的技术。

原创 2022-08-26 16:46:12 · 421 阅读 · 0 评论
快速实现 CDN 直播

ZEGO Express SDK 支持推流到 CDN（Content Delivery Network，内容分发网络），包括转推 CDN 和直推 CDN 两种功能。开发者基于该功能可打通 RTC 产品和 CDN 直播产品，方便用户从网页或第三方播放器直接观看和收听直播内容。为了保证安全，推流到 CDN 时默认开启 CDN 鉴权。为防止攻击者盗取或伪造您的推流 URL 地址，您可以参考。...

原创 2022-08-12 14:05:59 · 1021 阅读 · 0 评论
音视频开发进阶｜音频编解码的必要性解读与格式选取

在上一篇文章中，我们完成了对音频前处理三剑客的学习。声音信号经过音频前处理模块，已经“洗尽铅华、去除杂质”，现在，你是否已迫不及待想要将它们分享到世界各地了呢？但稍安勿躁，想要更好地与世界分享我们的声音，还有一个不得不考虑的问题，而这个问题将由我们今天的主角 “音频编解码”来解决。我们都知道，要想把音视频数据实时分享到世界的各个角落，有一个传输工具必不可少：网络。而要用好这个传输工具，有一个必须关注的点：网络带宽。作为资深网民，大家肯定都了解过带宽。它指的是网络链路1秒钟内能传输的最大数据量，其单位一般使用

原创 2022-08-12 10:59:44 · 953 阅读 · 0 评论
音频自动增益控制 AGC 解决的问题及原理解析

什么是“音量”？音量“增益”的本质是什么？AGC 进行音量增益“自动控制”的策略是什么？

原创 2022-07-19 11:24:56 · 8169 阅读 · 0 评论
音视频基础知识｜ANS 噪声抑制原理解析

噪声问题和回声问题一样，严重影响音视频场景下的用户体验，是所有开发者绕不开的槛。

原创 2022-06-17 11:15:27 · 4698 阅读 · 1 评论
音视频处理三剑客之 AEC：回声产生原因及回声消除原理

AEC：回声产生原因及回声消除原理解析！

原创 2022-06-10 11:19:30 · 4656 阅读 · 2 评论
音视频开发基础入门｜声音的采集与量化、音频数字信号质量、音频码率

栏目介绍：为了帮助开发者更好的理解音视频概念，进行音视频应用开发，ZEGO 即构科技联合内部音视频开发专家打磨了本套《音视频开发进阶》课程，帮助大家轻松入门并可以自己动手开发音视频 App！本次课程为系列内容，课程将从音视频基础概念讲解展开，进行学习内容的难度进阶，后期将带领大家学习有关音视频开发的各种疑难问题，以及如何利用 SDK 开发音视频应用！内容定期更新推送，请持续关注！前言“风声，雨声，读书声，声声入耳”，关于声音，大家肯定都不陌生。作为最基础的信息载体之一，声音被用于社交沟通

原创 2022-05-20 10:50:13 · 6539 阅读 · 0 评论