流媒体开发入门：实时语音房间开发

Vzhangs

已于 2024-04-11 00:46:26 修改

阅读量365

点赞数 8

文章标签：实时音视频

于 2024-04-08 13:53:32 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_42277430/article/details/137218354

版权

公司计划自研游戏实时语音房间服务，面临技术难题如低延迟、丢包处理和噪声消除。决定采用BS架构，通过AAC压缩减少带宽，考虑网络补偿算法和补帧模型。同时，需兼容Android的RTSP和iOS的HLS协议。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

背景：公司的游戏实时语音房间使用的腾讯的GVoice，希望自研一套实时语音房间服务，现在做一些技术调研

技术难点:

实时性，最好在300ms以下
网络原因产生的丢包问题
噪声消除、回声消除

初步的解决方案:

对于数据传输，有两种模式可选

BS架构：客户端推流到服务端，服务端混流，客户端再拉流
P2P架构：参考WebRTC，服务端部署信令服务器，客户端P2P的通话

调研了各家云服务厂的解决方案，大部分都是混合架构，相当于在P2P架构中加入一个特殊的客户端——即BS架构中的服务端。但开发时间有限，需要从BS架构与P2P架构中任选其一。
对于P2P架构，个人不是很自信，参考WebRTC，由于不是每个客户端都会有公网IP，两个客户端的通信中间需要进行NET穿透，ICE协议无法保证一定能找到双方可用的通信地址，因此可能会存在无法建立通信的情况。
并且，P2P架构下，适用范围更窄，基本仅适用于4人以下实时音频房间。
故使用BS架构，BS架构的缺点在于，由于要经过服务端，实时性一定比P2P更差，且服务器维护费用也会比P2P模式高得多。

技术难点的初步解决方案

实时性：使用AAC格式有损压缩音频数据，减小带宽占用。
网络原因产生的丢包问题：初步有三个想法，一是查找下有没有某种补偿算法，二是在每个音频包里携带上一帧的有损压缩信息，三是看有没有可能搞一个补帧模型，现在很多手机自带NPU，应该有本地AI部署能力。
噪声消除、回声消除：现在的手机很多都自带降噪芯片，但对于部分低端机无法保证有这个降噪芯片，需要在先实现一个先看看效果，如果低端机效果很差，可能需要研究研究降噪算法或者降噪模型。

初步实现思路：

客户端方面，开启录音，20ms切个片，做回声消除等，再使用FFmpeg转成AAC后上传
服务端使用FFmpeg，拿到音频切片后混合各个客户端的音频
流媒体通信协议方面，调研后发现Android大部分使用RTSP，IOS不开放底层协议，只能用HLS协议，因此服务端也需要做两份协议的支持。

个人对流媒体开发目前并不熟悉，赶鸭子上架，若有错误的地方请评论指正

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。