音视频基础
文章平均质量分 90
音视频开发过程好文章转载和总结记录
码流怪侠
欢迎关注「码流怪侠」! 这里聚焦视频编解码、音视频处理、AI技术与图像处理等前沿领域,为您带来行业动态、深度解析与实用干货,助力您掌握核心技术,探索创新应用场景,与行业精英共同成长。
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
离散余弦变换(DCT)深度解析:从数学原理到工程实践
离散余弦变换(DCT) DCT变换、DCT反变换、分块DCT变换一、引言 DCT变换的全称是离散余弦变换(Discrete Cosine Transform),主要用于将数据或图像的压............原创 2018-08-26 14:03:27 · 39372 阅读 · 7 评论 -
YUV 与 RGB 采样格式深度解析:从入门到专家
在音视频开发的路上,YUV 是一个绕不过去的坎。几乎所有视频编解码(H.264、H.265、VP8、VP9、AV1)、流媒体传输(RTMP、HLS、DASH)以及图像处理领域,都在和 YUV 打交道。很多开发者知道"YUV 是视频存储格式",但问到4:2:0 到底比 4:4:4 省了多少数据I420 和 NV12 的区别是什么RGB888 转 YUV 的公式怎么来的,往往一头雾水。色彩模型基础:RGB 和 YUV 的数学原理与物理意义YUV 采样格式。原创 2026-05-20 16:44:59 · 302 阅读 · 0 评论 -
视频直播技术全栈深入解析:从入门到精通
层级核心技术选型建议采集YUV420 采样 / GPU 预处理确保 30FPS 以上帧率视频编码H.264 (直播) / AV1 (点播)实时性 > 压缩率时选 H.264音频编码AAC-LC (直播) / Opus (互动)实时互动首选 Opus推流协议RTMP (推流入口)工业级成熟,稳定可靠分发协议HLS (大规模) / HTTP-FLV (低延迟) / WebRTC (互动)三者配合使用服务端SRS / ZLMediaKit (开源) / 云服务 (商用)按规模选型播放器原生优先。原创 2026-05-18 16:13:27 · 807 阅读 · 0 评论 -
Android MediaCodec 全面详解:从入门到精通
MediaCodec 是 Android 系统提供的底层媒体编解码接口,用于访问设备上的硬件或软件编解码器。它是 Android 多媒体支持基础设施的核心组件之一,自 API Level 16 (Android 4.1) 开始引入。简单来说,MediaCodec 就是 Android 系统中负责压缩数据 ↔ 原始数据转换的"翻译官":1.2 核心特点特性说明底层API比 MediaPlayer、VideoView 更底层,提供了更精细的控制软硬通吃可使用软件编解码器,也可使原创 2026-05-17 18:14:41 · 435 阅读 · 0 评论 -
【GitHub】CVPR 2025 Highlight Paper|SEVC 开源代码深度解读:从论文到实现的完整工程实践
│ SEVC 开源代码的工程亮点 ││ ││ 🏗️ 模块化设计 ││ 分层解耦:BL/ILP/EL 各自独立,可单独替换和调试 ││ ││ 🔄 双缓冲参考管理 ││ BL 和 EL 各自维护独立的参考缓冲,实现干净的状态隔离 ││ ││ 🧩 特征适配器 ││ 通过可学习适配器实现跨层特征传递,避免信息瓶颈 ││ ││ ⚡ C++ 熵编码 ││ 关键路径使用 C++ 实现(ANS算法),Python调用 ││ ││ 🔧 多进程测试框架 │。原创 2026-05-12 17:46:45 · 163 阅读 · 0 评论 -
【GitHub】Microsoft VibeVoice 深度解析:开源语音AI全家桶,90分钟长语音合成+60分钟语音识别
挑战具体问题长序列处理传统TTS帧率高达50-600Hz,处理1小时音频产生~108K-1.3M个token,远超LLM上下文窗口多说话人一致性现有模型多支持1-2个说话人,长对话中说话人切换不自然,音色一致性差语音自然度合成语音缺乏真实对话的"氛围感"(Vibe),情感表达和韵律变化生硬VibeVoice是微软研究院于2025年8月开源的前沿语音AI模型家族,采用 MIT 许可证,在 GitHub 上获得,全球排名 #480。属性信息发布方开源时间2025年8月25日许可证46.2k+ ⭐。原创 2026-05-05 10:02:54 · 781 阅读 · 0 评论 -
【论文解析】Analysis of Neural Video Compression Networks for 360-Degree Video Coding
随着虚拟现实(VR)、增强现实(AR)技术的商业化落地,高质量 360° 全景视频的高效压缩成为多媒体通信领域的核心刚需。传统混合视频编码标准已完成迭代升级,最新的 H.266/VVC 已内置 360° 视频专用编码工具,同时行业也研发了多种提升压缩效率的 360° 投影格式。但在快速发展的 神经视频压缩网络(NVC)领域,不同 360° 投影格式对整体压缩性能的影响从未被系统性研究。原创 2026-03-24 15:58:08 · 62 阅读 · 0 评论 -
深入解析Vulkan技术:下一代图形渲染API的核心原理与应用
深入解析Vulkan技术:下一代图形渲染API的核心原理与应用原创 2025-11-04 22:01:38 · 1882 阅读 · 0 评论 -
OpenCV音视频编解码器详解
OpenCV音视频编解码器详解原创 2025-11-02 23:16:00 · 1655 阅读 · 0 评论 -
DCT与DST变换原理及其在音视频编码中的应用解析
DCT与DST变换原理及其在音视频编码中的应用解析原创 2025-09-30 09:56:16 · 1191 阅读 · 0 评论 -
Nginx-RTMP-Module开源项目全解析:从基础部署到企业级应用实践
Nginx-RTMP-Module开源项目全解析:从基础部署到企业级应用实践原创 2025-09-18 16:58:59 · 1480 阅读 · 0 评论 -
音视频基础概念全面解读:从原理到应用
音视频基础概念全面解读:从原理到应用原创 2025-09-14 20:58:05 · 1377 阅读 · 0 评论 -
VideoMAE开源项目全解析:从技术原理到实践应用
VideoMAE开源项目全解析:从技术原理到实践应用原创 2025-09-01 18:10:50 · 1895 阅读 · 0 评论 -
深入解析quiche开源项目:从QUIC协议到云原生实践
深入解析quiche开源项目:从QUIC协议到云原生实践原创 2025-09-01 17:17:40 · 1437 阅读 · 0 评论 -
实时音视频延迟优化指南:从原理到实践
实时音视频延迟优化指南:从原理到实践原创 2025-08-29 16:59:31 · 2807 阅读 · 0 评论 -
视频软解码技术详解:原理、应用与未来发展
视频软解码技术详解:原理、应用与未来发展原创 2025-08-28 08:31:43 · 1944 阅读 · 0 评论 -
视频编码标准市场份额分析:2024-2025年技术演进与商业格局
视频编码标准市场份额分析:2024-2025年技术演进与商业格局原创 2025-08-21 15:31:07 · 3023 阅读 · 0 评论 -
SRS 流媒体服务器技术详解:从协议支持到企业级部署
SRS 流媒体服务器技术详解:从协议支持到企业级部署原创 2025-08-18 15:07:34 · 1975 阅读 · 0 评论 -
OpenAL技术详解:跨平台3D音频API的设计与实践
OpenAL技术详解:跨平台3D音频API的设计与实践原创 2025-08-18 14:52:33 · 1509 阅读 · 0 评论 -
深入解析live555:开源流媒体框架的技术原理与应用实践
深入解析live555:开源流媒体框架的技术原理与应用实践原创 2025-08-14 16:20:10 · 1494 阅读 · 0 评论 -
Google SoundStream音频编解码器技术解析
Google SoundStream音频编解码器技术解析原创 2025-08-13 11:32:27 · 883 阅读 · 0 评论 -
MP3音频编解码器技术详解
MP3音频编解码器技术详解原创 2025-08-13 11:03:18 · 1314 阅读 · 0 评论 -
AAC音频编码器技术详解:原理、应用与发展
AAC音频编码器技术详解:原理、应用与发展原创 2025-08-12 16:26:02 · 1522 阅读 · 0 评论 -
OpenCV深度解析:从基础到实战的计算机视觉库全指南
OpenCV深度解析:从基础到实战的计算机视觉库全指南原创 2025-08-10 10:41:15 · 2081 阅读 · 0 评论 -
WebAssembly技术详解:从浏览器到云原生的高性能革命
WebAssembly技术详解:从浏览器到云原生的高性能革命原创 2025-08-10 09:59:54 · 1329 阅读 · 0 评论 -
深入解析QUIC协议:下一代音视频传输技术的突破与实践
深入解析QUIC协议:下一代音视频传输技术的突破与实践原创 2025-08-09 16:29:17 · 1758 阅读 · 0 评论 -
Android MediaCodec 音视频编解码技术详解
Android MediaCodec 音视频编解码技术详解原创 2025-08-09 15:28:53 · 2020 阅读 · 0 评论 -
深入理解VideoToolbox:iOS/macOS视频硬编解码实战指南
深入理解VideoToolbox:iOS/macOS视频硬编解码实战指南原创 2025-08-08 14:34:49 · 1891 阅读 · 0 评论 -
GStreamer:开源多媒体框架技术详解与应用实践
GStreamer:开源多媒体框架技术详解与应用实践原创 2025-08-08 09:57:55 · 1634 阅读 · 0 评论 -
2025年主流开源音视频播放项目深度解析
2025年主流开源音视频播放项目深度解析原创 2025-08-07 20:30:58 · 2782 阅读 · 0 评论 -
音视频时间戳获取与同步原理详解
音视频时间戳获取与同步原理详解原创 2025-08-07 18:16:42 · 1920 阅读 · 0 评论 -
音视频传输协议深度解析:RTP与RTMP技术对比及2025年应用趋势
音视频传输协议深度解析:RTP与RTMP技术对比及2025年应用趋势原创 2025-08-06 16:28:06 · 2144 阅读 · 0 评论 -
WebRTC音视频编码模块深度解析:从编解码器到自适应码率控制(2025技术实践)
WebRTC音视频编码模块深度解析:从编解码器到自适应码率控制(2025技术实践)原创 2025-08-05 18:38:47 · 2801 阅读 · 0 评论 -
Opus音频编码器全解析:从技术原理到实战应用
Opus音频编码器全解析:从技术原理到实战应用原创 2025-07-31 22:01:35 · 2217 阅读 · 0 评论 -
WebRTC核心组件技术解析:架构、作用与协同机制
WebRTC核心组件技术解析:架构、作用与协同机制原创 2025-07-30 21:00:25 · 1704 阅读 · 0 评论 -
WebRTC 2025全解析:从技术原理到商业落地
WebRTC 2025全解析:从技术原理到商业落地原创 2025-07-29 17:45:59 · 2433 阅读 · 0 评论 -
深入解析mediasoup:构建实时音视频通信的高性能SFU解决方案
深入解析mediasoup:构建实时音视频通信的高性能SFU解决方案原创 2025-07-29 16:37:37 · 2175 阅读 · 1 评论 -
视频编解码技术的未来趋势:从H.266到AI驱动的绿色革命
视频编解码技术的未来趋势:从H.266到AI驱动的绿色革命原创 2025-07-22 14:58:32 · 2741 阅读 · 0 评论 -
解码视觉体验:视频分辨率、屏幕尺寸、屏幕分辨率与观看距离的科学关系
解码视觉体验:视频分辨率、屏幕尺寸、屏幕分辨率与观看距离的科学关系原创 2025-07-21 10:37:41 · 2487 阅读 · 0 评论 -
2025年视频超高清技术应用全景介绍
2025年视频超高清技术应用全景介绍原创 2025-07-17 16:19:35 · 2655 阅读 · 0 评论
分享