音视频基础
sunxiaopengsun
这个作者很懒,什么都没留下…
展开
-
[视频编码] Image Stride
在内存中存储一张图片时,并不是按照宽和高的大小尺寸分配比例,然后分配相应大小的内存,通常会在图片的每一行(此处假设图片的扫描方式是光栅扫描)都会有一些填充的字节,这些字节是用来帮助在内存中更好地存储和显示。而image stride这个概念正是描述真正每一行的像素的个数。具体的定义是:从一行的某一个像素,知道下一行相同的横坐标位置的像素,两者之间相差的像素个数值。通常image stride 是比image width 数值要更大的。从图中我们可以看出,左边是image的width,右边.转载 2022-03-23 16:25:05 · 286 阅读 · 0 评论 -
常用图像像素格式 NV12、NV2、I420、YV12、YUYV
常用图像像素格式 NV12、NV2、I420、YV12、YUYV_Blog of Chauncy Wang-CSDN博客_nv12转载 2021-09-11 09:34:48 · 310 阅读 · 0 评论 -
yuv 颜色详解
http://www.voidcn.com/article/p-klxbegkz-bph.html转载 2021-07-07 11:06:09 · 239 阅读 · 0 评论 -
获取PCM音频数据的声音分贝值
https://blog.csdn.net/ywl5320/article/details/79516092转载 2020-12-25 16:21:51 · 354 阅读 · 0 评论 -
图像原始格式(YUV444 YUV422 YUV420)一探究竟
https://blog.csdn.net/ywcpig/article/details/85230796转载 2020-11-27 10:12:12 · 496 阅读 · 0 评论 -
H5直播mse
https://www.jianshu.com/p/1bfe4470349bhttps://cloud.tencent.com/developer/article/1155707转载 2020-10-22 17:12:28 · 204 阅读 · 1 评论 -
ts流格式详解
https://blog.csdn.net/dxpqxb/article/details/79654004转载 2020-10-14 09:59:17 · 358 阅读 · 0 评论 -
计算G711语音的打包长度和RTP里timestamp(时间戳)的增长量
https://blog.csdn.net/tanningzhong/article/details/53261954转载 2020-08-10 17:56:46 · 266 阅读 · 0 评论 -
windows音频声卡采集
https://blog.csdn.net/su_vast/article/details/78317584转载 2020-03-25 15:43:42 · 306 阅读 · 0 评论 -
H264码流的两种形式:Annex B和AVCC——非常详细的翻译
https://blog.csdn.net/romantic_energy/article/details/50508332原创 2019-11-07 17:35:10 · 6595 阅读 · 0 评论 -
fdk-aac API编程实现pcm2aac
1、源码下载 点击打开链接2、交叉编译 # ./configure --prefix=$PWD/out --host=arm-hisiv100nptl-linux# make # make install 3、API应用 aacEncOpen allocate encoder instance with required configuration...转载 2018-07-31 16:02:26 · 654 阅读 · 1 评论 -
在ARM HI3531 linux上优化FAAC1.28运行速度
转载地址:https://blog.csdn.net/zz603976046/article/details/77683543前面写一篇文章介绍如何编译FAAC1.28http://blog.csdn.net/zz603976046/article/details/76904265*****************************************************...转载 2018-07-24 11:23:55 · 492 阅读 · 0 评论 -
使用fdkaac编码
转载地址:https://blog.csdn.net/lipku/article/details/78564518转载 2018-08-01 13:49:56 · 557 阅读 · 0 评论 -
faac库编码PCM数据
转载地址:https://blog.csdn.net/liyang051/article/details/46800401转载 2018-07-24 09:50:19 · 638 阅读 · 0 评论 -
h264 NAL头解析
NAL全称Network Abstract Layer,即网络抽象层。在H.264/AVC视频编码标准中,整个系统框架被分为了两个层面:视频编码层面(VCL)和网络抽象层面(NAL)。其中,前者负责有效表示视频数据的内容,而后者则负责格式化数据并提供头信息,以保证数据适合各种信道和存储介质上的传输。NAL单元是NAL的基本语法结构,它包含一个字节的头信息和一系列来自VCL的称为原始字节序列载荷(R...原创 2018-06-27 09:47:35 · 233 阅读 · 0 评论 -
RTP协议之Header结构解析
https://blog.csdn.net/bingqingsuimeng/article/details/9997267转载 2019-05-22 10:57:29 · 171 阅读 · 0 评论 -
[最详细的FAAC1.28交叉编译过程] AAC算法移植
折腾2个星期,就搞出这个 因为是要在hi3531开发板上做一次aac算法的编码,下面将在移植过程中遇到的坑记录一下前提是你系统已经安装好你的交叉编译环境和已经下载了faac1.28官方地址是http://www.audiocoding.com/index.html开发环境:Ubantu12.04.2交叉编译器:hisiv300-linux-g++,hisiv300-linux...转载 2018-07-08 16:55:06 · 767 阅读 · 0 评论 -
图文详解YUV420数据格式
转载自: http://www.cnblogs.com/azraelly/archive/2013/01/01/2841269.htmlYUV格式有两大类:planar和packed。对于planar的YUV格式,先连续存储所有像素点的Y,紧接着存储所有像素点的U,随后是所有像素点的V。对于packed的YUV格式,每个像素点的Y,U,V是连续交*存储的。 YUV,分为三个分量,“...转载 2018-08-28 14:31:35 · 170 阅读 · 0 评论 -
详解YUV420数据格式
https://blog.csdn.net/u010652002/article/details/79580706转载 2018-11-14 17:59:37 · 142 阅读 · 0 评论 -
h264 NALU的获取与分析
转载地址 :https://blog.csdn.net/xiaoluer/article/details/53462894一、如何从H264数据流中获取NALU0x00000001或0x000001是一个nalu的起始标志,遇到下一个此标志时为该nalu的结尾。起始标志的后面第一个字节(type)里包含有nalu的类型,type & 0x1F即为该nalu的类型(nal_unit_t...转载 2019-03-14 11:16:26 · 688 阅读 · 0 评论 -
H264码流结构分析
https://blog.csdn.net/chenchong_219/article/details/37990541转载 2019-03-18 07:21:00 · 163 阅读 · 0 评论 -
H264--NALU/SPS/PPS
H264结构中,一个视频图像编码后的数据叫做一帧,一帧由一个片(slice)或多个片组成,一个片由一个或多个宏块(MB)组成。H264编码过程中的三种不同的数据形式:SODB数据比特串 ---->最原始的编码数据,即VCL数据;RBSP 原始字节序列载荷 ---->在SODB的后面填加了结尾比特(RBSP trailing bits 一个bit“1”)若干比特“0”...转载 2019-05-21 14:07:41 · 815 阅读 · 0 评论 -
RTP报文头中的SSRC和CSRC
同步信源(SSRC)标识符:占32位,用于标识同步信源。该标识符是随机选择的,参加同一视频会议的两个同步信源不能有相同的SSRC。·特约信源(CSRC)标识符:每个CSRC标识符占32位,可以有0~15个。每个CSRC标识了包含在该RTP报文有效载荷中的所有特约信源。这里的同步信源是指产生媒体流的信源,例如麦克风、摄像机、RTP混合器等;它通过RTP报头中的一个32位数字SSRC标识符来标...原创 2019-05-22 10:47:43 · 2800 阅读 · 2 评论 -
理解TCP长连接(Keepalive)
TCP Keepalive的起源TCP协议中有长连接和短连接之分。短连接环境下,数据交互完毕后,主动释放连接;长连接的环境下,进行一次数据交互后,很长一段时间内无数据交互时,客户端可能意外断电、死机、崩溃、重启,还是中间路由网络无故断开,这些TCP连接并未来得及正常释放,那么,连接的另一方并不知道对端的情况,它会一直维护这个连接,长时间的积累会导致非常多的半打开连接,造成端系统资源的消耗和浪...转载 2019-05-27 13:46:47 · 446 阅读 · 0 评论 -
h264 流、帧结构
H264元素的分层结构H.264编码器输出的Bit流中,每个Bit都隶属于某个句法元素。句法元素被组织成有层次的结构,分别描述各个层次的信息。 在H.264 中,句法元素共被组织成 序列、图像、片、宏块、子宏块五个层次。在这样的结构中,每一层的头部和它的数据部分形成管理与被管理的强依赖关系,头部的句法元素是该层数据的核心,而一旦头部丢失,数据部分的信原创 2017-05-27 15:55:21 · 531 阅读 · 0 评论 -
EasyStream系列10之directshow转rtmp
EasyStream介绍 EasyStream SDK使用 EasyStream系列1之rtsp转rtmp EasyStream系列2之rtmp转rtsp EasyStream系列3之rtsp转rtsp EasyStream系列4之rtmp转rtmp EasyStream系列5之本地文件转rtsp EasyStream系列6之本地文件转rtmp Ea原创 2017-08-17 15:36:27 · 503 阅读 · 0 评论 -
EasyStream系列9之directshow转rtsp
EasyStream介绍 EasyStream SDK使用 EasyStream系列1之rtsp转rtmp EasyStream系列2之rtmp转rtsp EasyStream系列3之rtsp转rtsp EasyStream系列4之rtmp转rtmp EasyStream系列5之本地文件转rtsp EasyStream系列6之本地文件转rtmp Ea原创 2017-08-17 15:35:13 · 524 阅读 · 0 评论 -
EasyStream系列8之录制rtmp流
EasyStream介绍 EasyStream SDK使用 EasyStream系列1之rtsp转rtmp EasyStream系列2之rtmp转rtsp EasyStream系列3之rtsp转rtsp EasyStream系列4之rtmp转rtmp EasyStream系列5之本地文件转rtsp EasyStream系列6之本地文件转rtmp Ea原创 2017-08-17 15:32:28 · 529 阅读 · 0 评论 -
H264 各种profile
提到High Profile H.264解码许多人并不了解,那么到底什么是High Profile H.264解码?其应用效果又是如何呢? 作为行业标准,H.264编码体系定义了4种不同的Profile(类):Baseline(基线类),Main(主要类), Extended(扩展类)和High Profile(高端类)(它们各自下分成许多个层): Baseline原创 2017-06-14 14:16:55 · 343 阅读 · 0 评论 -
音频AAC编码的RTMP直播
RTMP直播,音频编码采用AAC时,需要把帧头的数据去掉。第一个数据包,发送4个字节,前面两个是0xAF、0x00,我看有文章写的是这个0xAF的A代表的是AAC,说明如下:0 = Linear PCM, platform endian1 = ADPCM2 = MP33 = Linear PCM, little endian4 = Nellymoser 16 kHz原创 2017-06-14 10:46:26 · 827 阅读 · 0 评论 -
centos6、7安装vlc
VLC media player (commonly known as VLC) is a portable, free and open-source, cross-platform media player and streaming media server written by the VideoLAN project. VLC media player supports many aud原创 2017-06-04 08:56:57 · 469 阅读 · 0 评论 -
VS2010编译jpeg.lib
1. 下载jpegsr9a.zip官网:http://www.ijg.org/---------------------------------------------------------------------------2. 打开VS2010命令行,进入jpeg-9a目录--------------------------------原创 2017-05-29 20:35:48 · 906 阅读 · 0 评论 -
TS流分析
一 从TS流开始 数字电视机顶盒接收到的是一段段的码流,我们称之为TS(Transport Stream,传输流),每个TS流都携带一些信息,如Video、Audio以及我们需要学习的PAT、PMT等信息。因此,我们首先需要了解TS流是什么,以及TS流是怎样形成、有着怎样的结构。(一) TS流、PS流、PES流和ES流都是什么? ES流(Eleme原创 2017-05-27 16:49:17 · 455 阅读 · 0 评论 -
mp4 流化本质
MP4目前被广泛用于封装h.264视频和AAC音频,是高清视频的代表。 本文提出了基于MP4文件存储格式的高效实时流化技术。流化的本质就是按顺序提取音视频帧的过程,即计算每个数据帧在文件中的偏移量的问题。由于MP4文件的音视频帧在文件中的物理位置不是顺序存放,而是以一种相对凌乱的状态存在,若在媒体数据播放的过程中,计算每帧偏移量难以做到高效率。因为计算偏移量是个相对繁琐的过程,要计算多级偏移和很多原创 2017-05-27 16:32:13 · 2922 阅读 · 0 评论 -
AAC ADTS格式分析
1.ADTS是个啥ADTS全称是(Audio Data Transport Stream),是AAC的一种十分常见的传输格式。记得第一次做demux的时候,把AAC音频的ES流从FLV封装格式中抽出来送给硬件解码器时,不能播;保存到本地用pc的播放器播时,我靠也不能播。当时崩溃了,后来通过查找资料才知道。一般的AAC解码器都需要把AAC的ES流打包成ADTS的格式,一般是在AAC原创 2017-05-12 13:43:29 · 289 阅读 · 0 评论 -
解析MP4文件中的sps和pps
一、MP4格式基本概念MP4格式对应标准MPEG-4标准(ISO/IEC14496) 二、MP4封装格式核心概念1 MP4封装格式对应标准为 ISO/IEC 14496-12(信息技术 视听对象编码的第12部分: ISO 基本媒体文件格式/Information technology Coding of audio-visual objects Part 12转载 2017-04-28 18:07:05 · 1941 阅读 · 0 评论 -
H264中的SPS、PPS提取与作用
牛逼的视频会议网站:http://wmnmtm.blog.163.com/blog/#m=0++++++++++++++++++++++++++++++++++++++++++++++++++++http://wmnmtm.blog.163.com/blog/static/38245714201192491746701/使用RTP传输H264的时候,需要用到sdp协议描原创 2017-02-17 11:07:04 · 347 阅读 · 0 评论 -
I,P,B帧和PTS,DTS的关系
基本概念:I frame :帧内编码帧 又称intra picture,I 帧通常是每个 GOP(MPEG 所使用的一种视频压缩技术)的第一个帧,经过适度地压缩,做为随机访问的参考点,可以当成图象。I帧可以看成是一个图像经过压缩后的产物。P frame: 前向预测编码帧 又称predictive-frame,通过充分将低于图像序列中前面已编码帧的时间冗余信息来压缩传输数据量的编码图原创 2017-02-08 14:38:53 · 274 阅读 · 0 评论 -
I帧 B帧 p帧 IDR帧的区别
IDR(Instantaneous Decoding Refresh)--即时解码刷新。 I帧:帧内编码帧是一种自带全部信息的独立帧,无需参考其它图像便可独立进行解码,视频序列中的第一个帧始终都是I帧。 I和IDR帧都是使用帧内预测的。它们都是同一个东西而已,在编码和解码中为了方便,要首个I帧和其他I帧区别开,所以才把第一个首个I帧叫IDR,这样就方便控制编码和解码流程。 I原创 2017-02-08 14:34:42 · 304 阅读 · 0 评论 -
计算 音频帧的播放时间
采样频率是指将模拟声音波形进行数字化时,每秒钟抽取声波幅度样本的次数。。正常人听觉的频率范围大约在20Hz~20kHz之间,根据奈奎斯特采样理论,为了保证声音不失真,采样频率应该在40kHz左右。常用的音频采样频率有8kHz、11.025kHz、22.05kHz、16kHz、37.8kHz、44.1kHz、48kHz等,如果采用更高的采样频率,还可以达到DVD的音质对采样率为44.原创 2017-01-10 14:45:20 · 486 阅读 · 0 评论