视音频编解码
文章平均质量分 84
qingkongyeyue
拼搏到无能为力,坚持到感动自己,有些路走下去很长,很累,但是不走会后悔。人生最大的痛苦,莫过于,坚持了不该坚持的,而放弃了不该放弃的
展开
-
FLV文件格式解析
https://wuyuans.com/2012/08/flv-format/flv文件主要由两部分组成:header和body。1.headerheader部分记录了flv的类型、版本等信息,是flv的开头,一般都差不多,占9bytes。具体格式如下:文件类型3 bytes“FLV”版本1 byte一般为0x01流信转载 2017-03-28 22:37:34 · 497 阅读 · 0 评论 -
X264编码流程详解
转自http://blog.csdn.net/xingyu19871124/article/details/7671634对H.264编码标准一直停留在理解原理的基础上,对于一个实际投入使用的编码器是如何构建起来一直感觉很神秘,于是决定在理解理论的基础上潜心于编码器实现框架。关于开源的H264编码器有很多,JMVC,T264、X264,这里选择X264,因为网上关于X264源码分析转载 2017-04-25 18:26:21 · 1515 阅读 · 0 评论 -
HEVC算法和体系结构:预测编码之帧内预测
转自https://yq.aliyun.com/articles/31084?spm=5176.100239.blogcont31083.8.NmFsyg预测编码之帧内预测(Intra-Picture Prediction) 预测编码(Prediction Coding)是视频编码的核心技术之一,指利用已编码的一个或几个样本值,根据某种模型或方法,转载 2017-04-30 19:32:18 · 1255 阅读 · 0 评论 -
HEVC算法和体系结构:编码框架
转自https://yq.aliyun.com/articles/31087?spm=5176.100239.blogcont31091.8.sWnZBM编码框架2013年4月13日HEVC/H.265被ITU-T正式接受为国际标准。类似以往的国际标准,HEVC仍旧采用“预测+变换”的混合编码框架,如下图所示,包括变换、量化、熵编码、帧内预测、帧间预测以及环路滤转载 2017-05-02 18:43:25 · 1609 阅读 · 0 评论 -
MP3编码分析
http://blog.csdn.net/xiahouzuoxin/article/details/7849249目录(?)[+]一MP3文件格式解析MP3文件结构二MP3编码原理三SHINE程序分析目录一、MP3文件格式解析....21、MP3文件及MPEG概述...2二、MP3编码原理....41、MP3编转载 2017-04-29 22:45:56 · 13955 阅读 · 1 评论 -
屏幕内容显示原理
位图图像:位图又叫点阵图,像素图,光栅图。位图有像素组成,位图的质量与像素分布以及分辨率有关。每个像素点由RGB三种颜色组成矢量图:矢量图使用直线和曲线来描述图形,这些图形的元素是一些点、线、矩形、多边形、圆和弧线等等,它们都是通过数学公式计算获得的。例如一幅花的矢量图形实际上是由线段形成外框轮廓,由外框的颜色以及外框所封闭的颜色决定花显示出的颜色。由于矢量图形可通原创 2017-05-10 18:56:59 · 4398 阅读 · 0 评论 -
字符编码笔记:ASCII,Unicode和UTF-8
转自http://www.ruanyifeng.com/blog/2007/10/ascii_unicode_and_utf-8.html1. ASCII码我们知道,在计算机内部,所有的信息最终都表示为一个二进制的字符串。每一个二进制位(bit)有0和1两种状态,因此八个二进制位就可以组合出256种状态,这被称为一个字节(byte)。也就是说,一个字节一共可以用来表示256种不同的状态转载 2017-05-10 18:51:36 · 606 阅读 · 1 评论 -
MP3文件实例剖析
转自http://blog.csdn.net/sunshine1314/article/details/2514322在VC++中打开一个名为test.mp3文件,其内容如下:000000 FF FB 52 8C 00 00 01 49 09 C5 05 24 60 00 2A C1000010 19 40 A6 00 00 05 96 41 34 18 20 80 0转载 2017-04-29 20:51:16 · 728 阅读 · 0 评论 -
RTP时间戳
转自http://xingyunbaijunwei.blog.163.com/blog/static/7653806720126121014111/基本概念: 时间戳单位:时间戳计算的单位不是秒之类的单位,而是由采样频率所代替的单位,这样做的目的就是为了是时间戳单位更为精准。比如说一个音频的采样频率为8000Hz,那么我们可以把时间戳单位设为1 / 8000。时间戳增量:相邻两个R转载 2017-03-15 22:34:12 · 385 阅读 · 0 评论 -
H264(NAL简介与I帧判断)
转自http://blog.csdn.net/jefry_xdz/article/details/84613431、NAL全称Network Abstract Layer, 即网络抽象层。 在H.264/AVC视频编码标准中,整个系统框架被分为了两个层面:视频编码层面(VCL)和网络抽象层面(NAL)。其中,前者负责有效表示视频数据的内容,而后者则负责格式化数据并提供头信息转载 2017-01-04 21:13:48 · 421 阅读 · 0 评论 -
RTMP协议以及提取RTMP视频流组成H264视频文件
转自http://www.rosoo.net/a/201405/16980.html首先我们获得h264的流,在监听里,我们通过参数可以获得RTMP包 IStreamPacket,调用getData()方法直接获得包数据 放入IOBuffer。以下是提取并修改数据存成h264文件的步骤1. 添加监听 IStreamListener2. 通过IOBuffer的put函数将每次获得的包数据转载 2017-03-23 20:24:41 · 2653 阅读 · 0 评论 -
x264重要结构体详细说明: x264_sps_t、x264_pps_t
转自http://nkwavelet.blog.163.com/blog/static/227756038201431095653355//****************************************************************************************************************x264_sps_t 序转载 2017-03-23 21:25:27 · 610 阅读 · 0 评论 -
H.264中的SPS和PPS
参考http://blog.csdn.net/leixiaohua1020/article/details/11800877在分离H.264码流的时候,直接存储AVPacket后的文件可能是不能播放的。如果视音频复用格式是TS(MPEG2 Transport Stream),直接存储后的文件是可以播放的。复用格式是FLV,MP4则不行。经过长时间资料搜索发现,FLV转载 2017-01-04 21:43:48 · 26925 阅读 · 8 评论 -
H.264码流结构解析1
转自http://m.blog.csdn.net/article/details?id=511746801. H.264简介MPEG(Moving Picture Experts Group)和VCEG(Video Coding Experts Group)已经联合开发了一个比早期研发的MPEG 和H.263性能更好的视频压缩编码标准,这就是被命名为AVC(转载 2016-10-19 18:00:56 · 3639 阅读 · 0 评论 -
PCM语音编码
1、首先理解PCM是什么PCM 是Pulse Code Modulation的缩写,中文是脉冲编码调制,也就是说语音信号最终以脉冲形式编码。2、接下来理解一下PCM编码的步骤(1)采样(采样频率f1必须大于或等于所传输的模拟信号的最高频率的2倍)(2)量化(3)编码3、PCM的A律13折线编码归纳:(1)y轴等分成8分,而x轴按1/2比逐次缩小化取值,总原创 2016-08-04 20:54:25 · 17453 阅读 · 0 评论 -
信息熵和图像熵
1、信息熵作者:滴水链接:http://www.zhihu.com/question/22178202/answer/49929786来源:知乎著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。信息熵,信息熵,怎么看怎么觉得这个“熵”字不顺眼,那就先不看。我们起码知道这个概念跟信息有关系。而它又是个数学模型里面的概念,一般而言是可以量化的。所以,第一个问题转载 2016-07-10 13:51:39 · 24252 阅读 · 0 评论 -
与rtmp相关的结构体
转自http://blog.csdn.net/nb_vol_1/article/details/58660181与rtmp有关的结构体rtmp句柄 它表示了rtmp协议[cpp] view plain copy print?// rtmp表示了rtmp协议 typedef struct RTMP { i转载 2017-03-27 21:11:08 · 1409 阅读 · 1 评论 -
关于高清,720p,1080i,1080p的一些解释及深入剖析
转自http://blog.sina.com.cn/s/blog_66e3b90801017jyu.html1080P1080P是美国电影电视工程师协会(SMPTE)制定的最高等级高清数字电视的格式标准,有效显示格式为:1920×1080,像素数达到207.36万。1080P带来的高画质给消费者带来的是真正的家庭影院的视听享受,由于它向下全面兼容其它高清格式,通用性非常转载 2017-05-15 19:36:42 · 30111 阅读 · 0 评论 -
JPEG图像压缩算法流程详解
转自http://blog.csdn.net/carson2005/article/details/7753499JPEG是Joint Photographic Exports Group的英文缩写,中文称之为联合图像专家小组。该小组隶属于ISO国际标准化组织,主要负责定制静态数字图像的编码方法,即所谓的JPEG算法。JPEG专家组开发了两种基本的压缩算法、两种熵编码方法、四种编码模式。如转载 2017-04-22 15:23:01 · 48904 阅读 · 3 评论 -
AAC ADTS格式分析
转自http://blog.csdn.net/andyhuabing/article/details/40983423目录(?)[+]1ADTS是个啥2ADTS内容及结构3将AAC打包成ADTS格式1.ADTS是个啥ADTS全称是(Audio Data Transport Stream),是AAC的一种十分常见的传输格式。记得第一次做de转载 2017-04-27 20:15:52 · 738 阅读 · 0 评论 -
H.264格式分析
转自http://blog.csdn.net/caoshangpa/article/details/53019793一.H.264基本流结构H.264 的基本流(elementary stream,ES)的结构分为两层,包括视频编码层(VCL)和网络适配层(NAL)。视频编码层负责高效的视频内容表示,而网络适配层负责以网络所要求的恰当的方式对数据进行打包和传送。引入NAL并使之与VCL分离转载 2017-03-07 23:10:35 · 620 阅读 · 0 评论 -
H264--2--基础知识
参考http://blog.csdn.net/yangzhongxuan/article/details/8003494名词解释场和帧 : 视频的一场或一帧可用来产生一个编码图像。在电视中,为减少大面积闪烁现象,把一帧分成两个隔行的场。片: 每个图象中,若干宏块被排列成片的形式。片分为I片、B片、P片和其他一些片。转载 2016-10-19 20:30:34 · 584 阅读 · 0 评论 -
CMMB中的H264和AAC打包成ts流
原文地址:(转)CMMB中的H264和AAC打包成ts流作者:南冠彤http://blog.csdn.net/zs_pro_popper/article/details/8179734参照tstools这个开源项目完成了CMMB的merge aac with 264 to TS.在做的过程中,分成了几个阶段。先试着将H264打包成TS,这花了最大的精力和时间;接着将AAC打转载 2017-08-13 10:43:22 · 703 阅读 · 0 评论 -
YUV采样格式
主要的采样格式有YCbCr 4:2:0、YCbCr 4:2:2、YCbCr 4:1:1和 YCbCr 4:4:4。其中YCbCr 4:1:1 比较常用,其含义为:每个点保存一个 8bit 的亮度值(也就是Y值), 每 2x2 个点保存一个 Cr 和Cb 值, 图像在肉眼中的感觉不会起太大的变化。所以, 原来用 RGB(R,G,B 都是 8bit unsigned) 模型, 4 个点需要 8x3=2转载 2016-08-10 12:24:00 · 1978 阅读 · 0 评论 -
预测编码
转自http://www.cnblogs.com/irish/archive/2013/06/21/3148768.html1.1 定义预测编码是数据压缩理论的一个重要分支。根据离散信号之间存在一定相关性特点,利用前面的一个或多个信号对下一个信号进行预测,然后对实际值和预值的差(预测误差)进行编码。如果预测比较准确,那么误差信号就会很小,就可以用较少的码位进行编码,以达到数据压转载 2017-07-27 20:36:09 · 34158 阅读 · 1 评论 -
音频 属性详解(涉及采样率、通道数、位数、比特率、帧等)
转自http://blog.csdn.net/beiliufangdegezhe/article/details/41517307音频】指人耳可以听到的声音频率在20HZ~20kHz之间的声波(声音是一种横波,频率就是声波每秒震动的次数),称为音频。【采样频率】即取样频率, 指每秒钟取得声音样本的次数。采样频率越高,声音的质量也就越好,声音的还原也就转载 2017-08-19 13:10:10 · 6612 阅读 · 1 评论 -
HEVC算法和体系结构:编码结构之编码时的分层处理架构
转自https://yq.aliyun.com/articles/31086?spm=5176.100239.blogcont31087.13.CwFHrm编码结构之编码时的分层处理架构 本博文主要介绍HEVC编码结构中的“编码时的分层处理架构”。HEVC编码结构的主要目的就是为了各种应用下操作的灵活性以及数据损失的鲁棒性(所谓“鲁棒性”,是指控制转载 2017-04-27 20:54:35 · 2016 阅读 · 0 评论 -
HEVC编码结构分析
在H.264中,编码的基本单元是宏块,对于抽样格式为4:2:0的宏块,它包含一个16x16的亮度样本块和两个相应的8x8色度样本块,如下图所示。(1)、而在HEVC中,采用了一个新的编码结构——编码树单元(CTU),CTU是HEVC的基本处理单元。一个CTU包括1个亮度CTB、2个色度CTB和相应的语法元素。一个CTU可能只包含一个编码单元(CU),HEVC还能采用树型和类转载 2017-04-30 19:07:44 · 2406 阅读 · 0 评论 -
UDP-RTP协议解析
转自http://blog.csdn.net/leixiaohua1020/article/details/505352301、原理3、名词解释MPEG-TS(Transport Stream“传输流”;又称TS、TP、MPEG-TS)是用于音效、图像与数据的通信协定,最早应用于DVD的实时传送节目。实时传输协议RTP(Real-time Trans转载 2016-10-25 11:41:24 · 9785 阅读 · 0 评论 -
变换编码
转自http://blog.csdn.net/xiaohaijiejie/article/details/41208011变换编码: 1. 基本概念 为什么要用变换编码? 答:因为一副图像中直流和低频区占大部分,高频区占小部分。这样,空间域的图像变换到频域或所谓的变换域,会产生相关性很小的一些变换系数,并可转载 2017-07-25 22:59:53 · 6836 阅读 · 0 评论 -
视频编码(H264概述)
转自http://blog.chinaunix.net/uid-23883288-id-3034586.html一 视频编码介绍1.1 视频压缩编码的目标1)保证压缩比例2)保证恢复的质量3)易实现,低成本,可靠性 1.2 压缩的出发点(可行性)1)时间相关性在一组视频序列中,相邻相邻两帧只有极少的不同之处,这便是转载 2017-08-07 20:29:46 · 505 阅读 · 1 评论 -
FFmpeg裁剪说明
转自http://www.xuebuyuan.com/1501356.html1 configure参数1 通用选项在linux下进入终端,找到ffmpeg解压位置,输入如下命令: root@web ffmpeg]# ./configure –help 得到configure的基本选项参数,其并没有中文解释。--help 显示此帮助信息|print this m转载 2017-07-08 15:49:03 · 1170 阅读 · 0 评论 -
CAVLC和CABAC简介
转自http://blog.csdn.net/jubincn/article/details/6948334版权声明:本文为博主原创文章,未经博主允许不得转载。目录(?)[+]CABAC/CAVLCin H.264什么是熵编码?熵编码压缩是一种无损压缩,其实现原理是使用新的编码来表示输入的数据,从而达到压缩的效果。常用的熵编码有游转载 2017-07-29 21:33:00 · 1879 阅读 · 0 评论 -
高速二次线性插值算法
转自http://blog.163.com/chentong1115@126/blog/static/45314732200963093721544/原理 线性插值并不难理解。以图像处理领域为例,我们的理想图像是均匀的分布在二维平面直角坐标系中的,任意给出一对坐标,就应该能够得到一个对应的颜色值,然而现实是残酷的,我们只能够用离散的点阵信息来近似表现图像。现在假设给定一对坐标(2转载 2017-07-15 15:57:32 · 1265 阅读 · 0 评论 -
JPEG文件编/解码详解
转自http://blog.csdn.net/lpt19832003/article/details/1713718JPEG文件编/解码详解cat_ng 猫猫JPEG(Joint Photographic Experts Group)是联合图像专家小组的英文缩写。它由国际电话与电报咨询委员会CCITT(The International Telegraph and Telephon转载 2017-04-22 17:59:13 · 2147 阅读 · 1 评论 -
x264_param_t参数注解
转自http://blog.csdn.net/maopig/article/details/6718131typedef struct x264_param_t{ CPU 标志位 unsigned int cpu; int i_threads; 并行编码多帧 int b_deterministic; 是否允许非确定性转载 2017-03-20 11:46:02 · 438 阅读 · 0 评论 -
x264重要结构体详细说明(2): x264_image_t、x264_picture_t、x264_nal_t
转自http://blog.csdn.net/explorer_day/article/details/52239044/******************************************************************************************** x264_image_t 结构用于存放一帧图像实际像素数据。该结构体定义在x264.转载 2017-03-20 09:08:22 · 1239 阅读 · 0 评论 -
DC系数和AC系数
1、DC系数的中间格式计算 JPEG中为了更进一步节约空间,并不直接保存数据的具体数值,而是将数据按照位数分为16组,保存在表里面。这也就是所谓的变长整数编码VLI。即,第0组中保存的编码位数为0,其编码所代表的数字为0;第1组中保存的编码位数为1,编码所代表的数字为-1或者1......,如下面的表格所示,这里,暂且称其为VLI编码表:前面提到的那个DC差值为3转载 2017-02-27 16:17:41 · 10971 阅读 · 0 评论 -
FLV封装格式解析1
转自http://blog.csdn.net/leixiaohua1020/article/details/17934487FLV封装原理FLV(Flash Video)是Adobe公司设计开发的一种流行的流媒体格式,由于其视频文件体积轻巧、封装简单等特点,使其很适合在互联网上进行应用。此外,FLV可以使用Flash Player进行播放,而Flash Player转载 2016-10-24 15:07:28 · 1071 阅读 · 0 评论 -
FFmpeg+SDL视频播放器—图形界面版学习笔记
1、目录1、MFC知识(1)Edit Control 用于输入文件路径,Static Text用于做标记。控件用于显示视频画面的Picture Control。(2)在mfc里面,一个对话框对应的是C++里面的一个类,我们在创建工程的时候,有两个类,一个是工程名类,一个是工程名+Dlg类,这里Dlg是对话框的意思。我们的工程名是testplayermfc原创 2016-11-07 21:45:25 · 2835 阅读 · 0 评论