移动端/客户端音视频入门
文章平均质量分 62
IOT_SHUN
这个作者很懒,什么都没留下…
展开
-
流媒体-FLV格式详解及数据分析
一、FLV文件格式FLV包括文件头(File Header)和文件体(File Body)两部分。文件结构如图所示:二、FLV文件头header部分记录了flv的类型、版本等信息,是flv的开头,一般都差不多,占9bytes。具体格式如下:1. 文件标识(3B):总是为”FLV”,0x46 0x4c 0x562. 版本(1B):目前为0x013. 流信息(1B):文件的标志位说明。前5位保留,必须...转载 2018-03-30 16:36:27 · 4872 阅读 · 1 评论 -
aac和mp3的区别
两者都是有损压缩音频编码的方式,但市面上显然mp3的普及度要比aac高的多将倉木麻衣.-.[もう一度].单曲.(APE) 无损格式分别转成AAC格式的(.m4a)和MP3格式,两者码率均是320kps。再用adobe audition查看了这三份文件的频谱:1.原文件无损文件,因为是单曲,包括两份文件2.AAC格式的:3.mp3格式:从三张图可以看出AAC文件与APE文件的频谱非常接近,在高频20...转载 2018-04-15 20:08:05 · 15587 阅读 · 0 评论 -
MP3文件结构解析
1. MP3文件结构解析1.1. 概述1.1.1. 音频相关术语ü ID3:一般位于一个mp3文件的开头或末尾的若干字节内,记录该mp3文件的歌手、标题、专辑名称、年代、风格等信息,ID3分位两个版本,V1版ID3在文件末尾的固定128字节,以TAG字符开头,若没有则认为无ID3V1信息,V2版ID3位于mp3的开头,长度可变。ü 采样率:每秒从连续信号中提取并组成离散信号的采样个数,它用赫兹...转载 2018-04-15 20:01:26 · 4723 阅读 · 0 评论 -
YUV讲解
eg: rgb r:8 g:8 b:8 YUV 4:2:0 Y:U:V ==4:2:0(最常用) ...原创 2018-03-26 13:48:37 · 260 阅读 · 0 评论 -
NAL分析
1.NAL头2.NAL类型 5 IDR图像的片 7 序列参数集 ----- 8 图像参数集NAL类型介绍单一NALU的RTP包类型组合的NALU的RTP包分片NALU的RTP包····(1) (2)·········FU Header ---通过FU Header将分片的数据组合...原创 2018-03-26 13:37:14 · 399 阅读 · 0 评论 -
H264结构与码流
由于以太网传输数据最大一次性智能1500字节左右,所有视频数据得进行拆包H264网络传输的结构H264在网络传输的是NALU,NALU的结构是:NAL头+RBSP,实际传输中的数据流如图所示: 1、帧的划分1.1 H.264 帧对于 H.264 而言每帧的界定符为 00 00 00 01 或者 00 00 01。比如下面的 h264 文件片断这就包含三帧数据:00 00 00 01 67 42...原创 2018-03-26 13:15:43 · 578 阅读 · 0 评论 -
H264宏块的划分与帧分组
H264是新一代的编码标准,以高压缩高质量和支持多种网络的流媒体传输著称,在编码方面,我理解的他的理论依据是:参照一段时间内图像的统计结果表明,在相邻几幅图像画面中,一般有差别的像素只有10%以内的点,亮度差值变化不超过2%,而色度差值的变化只有1%以内。所以对于一段变化不大图像画面,我们可以先编码出一个完整的图像帧A,随后的B帧就不编码全部图像,只写入与A帧的差别,这样B帧的大小就只有完整帧的...转载 2018-03-26 11:38:39 · 2356 阅读 · 0 评论 -
视频基础知识
片只包含I宏块,P片可包含P和I宏块,而B片可包含B和I宏块。 I宏块利用从当前片中已解码的像素作为参考进行帧内预测。 P宏块利用前面已编码图象作为参考图象进行帧内预测。 B宏块则利用双向的参考图象(前一帧和后一帧)进行帧内预测。 片的目的...原创 2018-03-26 11:18:56 · 293 阅读 · 0 评论 -
编解码器的详细介绍
媒体业务是网络的主要业务之间。尤其移动互联网业务的兴起,在运营商和应用开发商中,媒体业务份量极重,其中媒体的编解码服务涉及需求分析、应用开发、释放license收费等等。最近因为项目的关系,需要理清媒体的codec,比较搞的是,在豆丁网上看运营商的规范 标准,同一运营商同样的业务在不同文档中不同的要求,而且有些要求就我看来应当是历史的延续,也就是现在已经很少采用了。所以豆丁上看不出所以然,从 wi...转载 2018-03-25 21:02:25 · 2974 阅读 · 0 评论 -
音频编解码器的介绍1
编解码 编解码器(codec)指的是一个能够对一个信号或者一个数据流进行变换的设备或者程序。这里指的变换既包括将 信号或者数据流进行编码(通常是为了传输、存储或者加密)或者提取得到一个编码流的操作,也包括为了观察或者处理从这个编码流中恢复适合观察或操作的形式的操作。编解码器经常用在视频会议和流媒体等应用中。...原创 2018-03-25 21:01:42 · 3008 阅读 · 0 评论 -
音乐压缩技术
音频压缩技术:频蔽效应是指人耳只对最明显的声音反应敏感,而对于不敏感的声音,反应则较不为敏感。例如在声音的整个频率谱中,如果某一个频率段的声音比较强,则人就对其它频率段的声音不敏感了。应用此原理,人们发明了mp3等压缩的数字音乐格式,在这些格式的文件里,只突出记录了人耳朵较为敏感的中频段声音,而对于较高和较低的频率的声音则简略记录,从而大大压缩了所需的存储空间。在人们欣赏音乐时,如果设备对高频响应...原创 2018-03-25 20:50:58 · 1265 阅读 · 0 评论 -
音频量化与编码
1.音频量化过程 首先声音是模拟信号,我们计算机只能识别0和1,所有需要对模拟信号进行量化,并编码。2.量化的基本概念3.码率计算原创 2018-03-25 20:21:02 · 6268 阅读 · 0 评论 -
音频基础知识
根据上图: 我们在压缩音频的时候,次声波和超声波部分便可去掉,因为这些属于不可听声波原创 2018-03-25 19:54:56 · 310 阅读 · 0 评论 -
手把手教你搭建一个直播服务器(Nginx+Rtsp)
本教程感谢慕课网常用工具: ffmpeg音视频编解码 ffplay音视频播放工具搭建流媒体服务器 准备流媒体服务器linux 准备并安装Nginx服务 配置RTMP并启动Nginx服务1.linxu安装Nginx和rtmp 1.先下载安装 ngi...原创 2018-03-25 16:28:30 · 50428 阅读 · 25 评论 -
CDN网络介绍
首先该教程感谢慕课网首先我们需要知道的是造成网络延迟的最大问题就是链路过长,什么叫链路过长呢? 我们网络数据传输呢是需要经过层层路由转发的,假如我们一个海南用户与东北用户通信的过程中,其中一个转发的路由出了问题,最终导致数据收发出问题,而CDN网络就是为了处理类似问题而生的。 CDN基本思路就是尽可能避开互联网上有可能影响数据传输速度和稳定性的瓶颈和环节,使内容传输的更快、更稳定。通...原创 2018-03-25 11:06:12 · 556 阅读 · 0 评论 -
实时互动直播框架
首先改教程得感谢慕课网实时互动直播和普通直播相比有本质的区别:延时。实时互动直播延时必须低达几百毫秒。为什么是几百毫秒?为什么不是几秒也不是几毫秒?这是由人们日常交流习惯决定的。人的说话声音通过声波传播,如果两人相隔34米,那么延时就是100毫秒。基于这个范围,略长的延时,观众还能。基于互联网的音视频通信,音频通话延时标准在400毫秒以内,视频通话延时在800毫秒以内,这可以让通话双方无延时感知的...原创 2018-03-25 10:40:14 · 4606 阅读 · 0 评论 -
深入浅出理解视频编码H264结构
引言:在国内直播"欣欣向荣"(ps: 其实大多都亏钱,为的就是炒概念)的年代,相信很多小伙伴也投入了技术的浩瀚大洋当中(ps: 其实就是搬砖),日复一日,音/视频的神秘面纱开始让更多的小伙伴扯下,而本博主,也只是刚窥探门道,慢慢摸索。好了,废话不扯,我们今天就来说说我们经常在视频编码当中用到的 H.264编码格式 的结构,相信 H.264 这个东西很多小伙伴都不陌生了,也有着自己的理解,但这东西颇...转载 2018-04-15 21:50:08 · 376 阅读 · 0 评论