音视频基础知识
文章平均质量分 69
音视频基础概念讲解
幽雨雨幽
C/C++软件工程师
展开
-
音频格式--PCM介绍
对于语音电话信道,每秒采集 8,000 个样本就足够了,即每 125 μs 采集一个样本,因为根据采样定理,当采集频率为最大频率两倍的电信号样本时信号,这些样本将包含重建原始信号所需的所有信息。PCM指的是脉冲编码调制(Pulse Code Modulation),是一种数字信号处理技术,将由波形表示的模拟音频信号转换为由1和0表示的数字音频信号。在电话交谈的采样中,由于样本在语音强度范围内可以有无限多个值,因此电话信道中的范围约为 60 dB。为了简化过程,所做的是对一系列预定值中最接近的值进行近似。转载 2024-03-29 16:56:41 · 12 阅读 · 0 评论 -
深度学习之语音识别-音频基础知识、声谱图(Spectrogram)
但由于谐波的多少不同,并且各谐波的幅度各异,因而产生了不同的音色。轻轻敲鼓时,鼓膜振动的幅度小,发出的声音弱。音色是人们区别具有同样响度、同样音调的两个声音之所以不同的特性,或者说是人耳对各种频率、各种强度的声波的综合反应。另外,人们对响度的感觉还和声波的频率有关,同样强度的声波,如果其频率不同,人耳感觉到的响度也不同。通过改变它们的振幅(amplitude),即这个震动的具有的能量大小,被称为音量(volume)纵坐标(频率):纵坐标表示声音频率,纵坐标越大,说明频率越高,越接近0,说明频率越低。转载 2024-01-24 11:07:50 · 143 阅读 · 0 评论 -
开源多媒体框架
Mpp的API思路其实跟目前绝大多数的编解码库是一致的,都是queue/dequeue的队列操作方式,先设置好编解码状态,然后不停的queue/dequeue input/output buffer就可以实现编解码控制了。一个良好的多媒体框架提供了一个直观的API和一个模块化的架构而易于添加对新的音频、视频和容器格式以及传输协议的支持。该文章记录的每个开源库的简介和链接地址,总结的很好,有常用的FFMPEG,WebRTC,VLC,X264、X265等,也有人工智能处理相关的,以及播放器类。转载 2023-01-19 14:48:34 · 531 阅读 · 0 评论 -
影音视频领域开源项目专区
ijkplayerExoplayerVLC PlayerDPlayer5KPlayer转载 2023-01-19 14:46:23 · 480 阅读 · 0 评论 -
流媒体基础知识TS流 PS流 ES流区别
IP数据报有首部和数据两部分组成的,首部的前一部分是固定长度20字节,是所有IP数据报必须具有的。首部包括:总长度、标识、MF、DF、片偏移。数字信号实际传送的是数据流,一般数据流包括以下三种:(1)ES流(Elementary Stream):也叫基本码流,包含视频、音频或数据的连续码流。(2)PES流(Packet Elementary Stream):也叫打包的基本码流,是将基本的码流ES流根据需要分成长度不等的数据包,并加上包头就形成了打包的基本码流PES流。(3)TS流:也叫传输流,是由固定长度为转载 2022-09-06 17:40:52 · 619 阅读 · 0 评论 -
音视频基础知识思维导图
音视频基础知识原创 2022-08-19 16:20:23 · 258 阅读 · 0 评论