嵌入式音视频开发之旅-CSDN博客

原创从零写一个ALSA声卡驱动学习(1)

不过，至少 ALSA 的内核 API 是一致的，因此本文档在编写这些驱动时仍然具有一定的参考价值。“card” 记录是声卡的核心管理结构，它负责管理该声卡上的所有设备（组件），例如 PCM、混音器（Mixer）、MIDI、合成器等。虽然 Linux 系统本身有标准的 i2c 层，但某些声卡只需要简单的操作，而标准的 i2c API 过于复杂，因此 ALSA 对某些声卡实现了自己的 i2c 代码。在 snd_mychip_probe() 函数中的注释行里标注的数字，对应的是下一节中将详细解释的内容。

2025-06-08 00:01:07 872

原创 RTMP协议基本介绍

当与可靠的传输协议如[TCP]一起使用时，RTMP块流提供了所有消息的保证有序端到端传递，这些消息跨越多个流，并且按照时间戳排序。例如，一个直播视频服务器可能会选择丢弃慢速客户端的视频消息，以确保音频消息能够及时接收，这基于发送每个消息所需的时间或确认每个消息所需的时间。除此之外，就RTMP块流而言，这是一个不透明的值。这篇备忘录描述了实时消息传输协议块流（RTMP块流），这是一种为多路复用和打包多媒体传输流（如音频、视频和交互式内容）而设计的应用程序级协议，它通过合适的传输协议（如TCP）进行传输。

2025-06-07 20:11:27 480

原创 rtp接收端，怎么解包rtp数据包？

如果检测到 DPA 丢失（在考虑了可能的重传和前向纠错（FEC）后），网关可以决定不发送对应的编码片段数据分区 B 和 C，因为对于 H.264 解码器来说，这些分区在没有 DPA 的情况下已经没有意义。如果发现某个 FU 丢失，网关可以决定不发送同一被片段化的 NAL 单元的后续 FU，因为在前面部分丢失的情况下，后续部分对 H.264 解码器已经无意义。对于所有包含同一个 NAL 单元片段的FU-A 包，去封装时，需要按照发送顺序将这些片段拼接起来，恢复成完整的 NAL 单元，再将其传递给解码器。

2025-04-20 11:29:47 360

原创 rtp三种模式传输打包规则：single nalu、non-interleaved、non-interleaved

禁止使用 STAP（单时间聚合包）、MTAP（多时间聚合包）和 FU（分片单元）。● 对于属于同一编码图像（coded picture）的编码切片 NAL 单元（coded slice NAL units）或编码切片数据分区 NAL 单元（coded slice data partition NAL units）（即它们共享相同的 RTP 时间戳），可以（MAY）以任意顺序发送；序列参数集和图像参数集的 NAL 单元可以被复制，以提高其正确接收的概率，但是，这种复制绝不能改变任何活动参数集的内容。

2025-04-19 16:19:11 750

原创 rtp载荷结构类型：单一NAL单元包、聚合包、分片单元

对于聚合包（Aggregation packets，如 STAP 和 MTAP），RTP 头部中的标记位必须设定为：如果聚合包中最后一个 NAL 单元单独传输时所应具有的标记位的值。例如，在视频编码 profile 允许任意片段顺序（arbitrary slice order）的情况下，同一编码图像的所有编码片段的 NAL 单元可以使用相同的 DON 值。发送端不应发送这些类型的NAL单元（无论是直接作为载荷，还是作为聚合包中的聚合单元，亦或是FU分片包中的分片单元），接收端必须忽略这些类型的NAL单元。

2025-04-12 23:58:25 616

原创 RTP Payload Format for H.264 Vide(1)

● 编码视频序列（coded video sequence）：按解码顺序排列的访问单元序列，由一个瞬时解码刷新（IDR）访问单元开始，后面跟着零个或多个非IDR访问单元，直到下一个IDR访问单元（不包括该IDR单元）为止。但在存在错误或丢包的码流中，冗余编码图像的内容可用于解码处理。● 默认子配置（default sub-profile）：编码工具的子集，可以是一个profile的全部编码工具，也可以是多个profile共有的编码工具子集，由 profile-level-id 参数指示。

2025-04-09 22:07:17 833 1

原创 rnn的音频降噪背后技术原理

这是一个传统噪声抑制算法的概念图示。2、避免“音乐噪声（musical noise）”伪影：所谓音乐噪声，是指噪声抑制时只让一个频点通过，而旁边的频点被强烈压制，从而产生类似“哒哒哒”或“嗡嗡嗡”的金属感杂音。如果使用较宽的频带，我们要么让整段频带通过，要么整体压制，这样就不会留下孤立的频点，从而避免这种伪影。此外，我们的目标也和很多使用深度学习做语音降噪的研究不同：我们关注的是实时通信，而不是语音识别。顾名思义，它的核心思想是：从一个带噪声的信号中尽可能去除噪声，同时对其中的语音内容造成最小的失真。

2025-04-02 19:59:32 672

空空如也

空空如也