音视频基础概念(4)—音视频开发常用工具

如序

已于 2023-04-04 23:03:08 修改

阅读量3k

点赞数 1

分类专栏：音视频编码文章标签：音视频 ffmpeg

于 2023-01-03 23:09:29 首次发布

本文链接：https://blog.csdn.net/u011937566/article/details/128462185

版权

音视频编码专栏收录该内容

5 篇文章

订阅专栏

本文介绍了VLC播放器的多功能特性，包括播放网络串流和作为流媒体服务器。MediaInfo用于分析多媒体文件的编码和内容信息。FLVAnalyser是FLV格式分析工具，而ElecardStreamAnalyzer则是码流分析软件。最后，FFmpeg作为一个跨平台的音视频处理库，提供录制、转换和流化功能。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

4. Elecard Stream Analyzer 码流分析工具

音视频知识比较复杂，掌握常用几款音视频开发工具，对初学者非常有帮助。

VLC是一款功能很强大的开源播放器，支持多种常见音视频格式，支持多种流媒体传输协议，也可当作本地流媒体服务器使用。

MediaInfo用来分析视频和音频文件的编码和内容信息。

Elecard Stream Analyzer是一款简单小巧的码流分析工具，通过该软件，用户可以快速地分析视频序列码流。

FFmpeg是一个跨平台的音视频处理库，是一套可以用来记录、转换数字音视频，并能将其转化成流的开源计算机程序。

1.VLC播放器简介

VLC是一款功能强大的开源播放器，VLC的全名为Video Lan Client，是一个开源的、跨平台的视频播放器。VLS支持多种常见音视频格式，支持多种流媒体传输协议，也可当作本地流媒体服务器使用。其官方下载地址为 https://www.videolan.org/ 。

1.1 VLC 播放器

VLC多媒体播放器是VideoLAN计划的多媒体播放器。它支持众多音频和视频解码器及文件格式，并支持DVD影音光盘、VCD影音光盘及各类流式协议。他也能作为unicast或multicast的流式服务器在IPv4或IPv6的高速网络连接下使用。它融合了FFmpeg的解码器和libdvdcss程序库，使其有播放多媒体文件及加密DVD影碟的功能。

作为音视频的初学者，很有必要熟练掌握VLC这个工具。

1.2 VLC的功能列表

VLC是一款自由、开源的跨平台多媒体播放器及框架，可播放大多数多媒体文件、DVD、CD、VCD及各类流媒体协议文件。VLC支持大量的音视频传输、封装和编码格式，下面列出简要的功能列表。

（1）操作系统包括 Windows、Windows CE、Linux、Mac OS X、BEOS、BSD等

（2）访问形式包括文件、DVD/VCD/CD、HTTP、FTP、TCP、UDP、HLS、RTSP等

（3）编码格式包括MPEG、DIVX、WMV、MOV、3GP、FLV、H.264、FLAC等

（4）视频字幕包括DVD、DVB、Text、Vobsub等

（5）视频输出包括DirectX、X11、XVideo、SDL、FrameBuffer、ASCII 等

（6）控制界面包括WxWidgets、QT、Web、Telnet、Command line等

（7）浏览器插件包括ActiveX、Mozilla等

1.3 VLC播放网络串流

VLC播放一个视频大致分为4个步骤：

access，即从不同的源获取流；
demux，即把通常合在一起的音频和视频分离（有的视频也包含字幕）；
decode，即解码，包括音频和视频的解码；
output，即输出，也分为音频和视频的输出（aout和vout）；

使用VLC可以很方便地打开网络串流。首先单击主菜单的“媒体”，选择“打开网络串流”，如下图1所，输入网络URL,单击“播放按钮”，即可看到播放的网络流效果。

测试地址为：http://devimages.apple.com/iphone/samples/bipbop/bipbopall.m3u8

1.4 VLC作为流媒体服务器

VLC功能很强大，不仅是一个视频播放器，也可以作为小型的视频服务器，一边播放一边转码，把视频流发送到网络上。VLC作为视频服务器的具体步骤如下。

（1）单击主菜单“媒体”中的“流”选项

（2）在弹出的对话框中单击“添加”按钮，选择一个本地视频文件，如下图所示。

（3）单击页面下方的“串流”下拉列表框中的“串流”选项，添加串流协议

（4）该页面会显示刚才选择的本地视频文件，然后单击“下一个”按钮

（5）在该页面单击“添加”按钮，选择具体的流协议，如RTSP，然后单击“下一个”按钮，如下图

（6）在该页面的下拉列表中选择“Video-H.264+MP3(TS)”，然后单击“下一个”按钮，如下图所示

注意：一定要选中左上方的“激活转码”，并且需要的是TS流格式。

（7）在该页面可以看到VLC生成的所有串流输出参数，然后单击“流”按钮即可，如下图所示

（8）说明在转码了

2. MediaInfo简介

2.1 MediaInfo

MediaInfo用来分析视频和音频文件的编码和内容信息，是一款自由软件，可以免费使用、免费获得源代码，许可协议是GNUGPL/LGPL。

官方下载地址：https://mediaarea.net/zh-CN/MediaInfo

2.1.1 获取多媒体文件信息

MediaInfo可以获取的多媒体文件的基本信息，具体包括以下几个方面。

（1）内容信息：标题、作者、专辑名、音轨号、日期、总时间等。

（2）视频：编码器、宽高比、帧频率、码率、比特率等。

（3）音频：编码器、采样率、声道数、语言、比特率等。

（4）文本：语言、字幕等。

（5）段落：段落数、列表等。

2.1.2 支持的格式

MediaInfo支持的格式很多，具体包括以下几种格式。

（1）视频：MKV、OGM、AVI、DivX、WMV、QuickTime、MPEG、DVD等。

（2）编码器：DivX、XviD、MSMPEG-4、ASP、H.264、AVC等。

（3）音频：OCG、MP3、WAV、RA、AC-3、DTS、AAC、M4A、AU、AIFF等。

（4）字幕：SRT、SSA、ASS、SAMI等.

2.1.3 .查看方式

MediaInfo支持众多查看方式，包括文本、表格、属性图、网页、HTML、XML等，如下图所示。它支持3种发布版本，包括图形界面、命令行、DLL(动态链接库)，还可以与Windows资源管理器整合，包括拖放、右击菜单等。

2.1.4 国际化

MediaInfo的软件界面可以轻松实现本地化，但需要当地的志愿者翻译语言文件。

2.2 MediaInfo使用方法

如果需要查看少数媒体文件的信息，则可以直接把文件拖入MediaInfo应用界面，然后就会直接显示出文件的相关信息，也可以直接查看整个文件夹下的媒体文件信息，可以单击界面左侧中间的图标。无论采用哪种方式，都可以查看视频、音频、图片的格式信息，如下图：

2.3 MediaInfo参数说明

媒体文件信息涉及的内容比较复杂，这里简单介绍一下。此处先把视图切换为HTML(View菜单—>HTML)。可以看出，媒体的详细信息主要包括3部分参数，分别是General、Video、Audio，分别如下所示。

（1）General主要包括视频封装格式信息，包括文件大小、文件时长、比特率、编码时间等.

（2）Video主要包括视频编码的相关信息，包括编码器、Profile&Level、是否使用算术熵编码、比特率、视频文件大小、视频尺寸、帧率模式、帧率、色彩空间、扫描类型（逐行/隔行）、编码设置等。

（3）Audio主要包括音频编码的相关信息，包括格式、声道数、编码格式、Profile、时长、比特率、是否有损压缩、音频的帧率等信息。

3. FlvAnalyser简介

下载地址：https://github.com/zymill/flvAnalyser

3.1 FLV简介

直播推流的时候需要用到RTMP的视频数据格式。RTMP的视频格式和FLV相似，通过查看FLV的格式文档，可以通过分析FLV协格式来解析RTMP格式。

RTMP中的数据就是由FLV的TAG中的数据区构成。FLV是流媒体封装格式，可以将其数据看为二进制字节流。

总体上看，FLV包括文件头（File Header）和文件体（File Body）两部分，其中文件体由一系列的Tag及Tag Size对组成，如下图所示。

3.2 FlvAnalyser

FlvAnalyser非常简单方便，功能也很强大，包括文件格式分析、数据分析、十六进制分析、时间戳分析、码率分析、音视频同步分析、日志记录、语法指南（FLV基本语法）、视频或音频ES提取文件、时间信息提取等。

查看文件信息，单击AV工具栏按钮，选择一个本地FLV文件，即可看到分析的效果，如下图所示。

查看Tag列表信息，单击“FLV 提取ES流”工具栏按钮，可以查看语法详情、NALU标注、二进制与十六进制切换等，显示效果如下图。

查看时间信息，单击“小时钟”工具栏按钮，可以查看时间信息，显示效果如下所示。

4. Elecard Stream Analyzer 码流分析工具

Elecard Stream Analyzer 是一款简单小巧的码流分析工具，通过该软件，用户可以快速地分析视频序列码流。软件操作简单，使用方便，用户只需将视频文件导入软件内，系统就会自动分析文件，分析后就会显示视频码的文件大小、码流类型、数据包数等内容，方便用户对视频的质量进行初步评估，可有效地改善视频的拍摄质量及制定相应的修改方案。

4.1 简介

码流是视频文件在单位时间内使用的数据流量，是视频编码中画面质量控制中最重要的部分。在同样的分辨率下，视频文件的码流越大，压缩比就越小，画面质量就越好。

多码流技术是通过在编码过程中同时产生多种不同码流及分辨率的流媒体数据，根据用户实际网络带宽条件为之自动分配相对最佳解码画质的解决方案。

在实际网络直播应用中，由于位于不同网络位置的访问者所在网络环境存在差异，而仅以某种固定码流分辨率进行网络直播流媒体传送往往会导致网络较高的用户看到的画质仍不够清晰，网速较低的用户由于解码时间过长而使画面不够流畅，为解决二者的矛盾使访问者浏览到尽可能兼顾清晰和流畅的直播内容，采用多码流技术成为一种最简单、最有效的方法。

Elecard StreamEye Tools是一款分析音视频的好工具，包括Elecard Stream Analyzer、Elecard StreamEye、Elecard YUV Viewer。

（1）Elecard StreamEye 用于编码视频的可视化表现，以及流结构分析，这些流是MPEG-1/2/4或AVC/H.264视频基本流（Video Element Stream,VES），MPEG-1的系统流（System Stream,SS）、MPEG-2的程序流（Program Stream,PS）、MPEG-2的传输流（Transport Stream,TS）。

（2）Elecard YUV Viewer 是用来看YUV视频文件数据序列的，和其他文件相比，找到二进制的图像是否匹配的，并且可观看比较结果。应用程序允许用户计算度量的质量，例如PSNR、NQI和VQM。

（3）Elecard Stream Analyzer 用于编码媒体流的语法分析，以及人类可读形式的展示，可以操作MPEG-1 Video/Audio、MPEG-2 Video/Audio、AAC、AC-3、AVC/H.264等。

其中 Elecard Stream Analyzer 主界面如下：

4.2 功能列表

Elecard Stream Analyzer 是一个专业的视频码流分析工具，功能非常强大。

拥有码流错误报告、TS错误侦测和基于ETSI TR101-290 的分析功能。
能够对编码器媒体流进行深入句法分析；
支持H.264/AVC、MPEG-2 TS/PS等多种常用的视频格式；
可以将ES码流导入到文件；
支持HEX浏览、导航和搜索；
支持音视频交织分析；
支持自动分析的命令行模式等。

Elecard Stream Analyzer 所支持的主要视频格式有 MPEG-2 TS、MPEG-2 PS、MPEG-1/2 Video Stream、AVC/H.264 Video Stream、HEVC/H.265 Video Stream、VP9 Video Stream、MP4 File Container、MKV File Container、AVI File Container等。

Elecard Stream Analyzer所支持的主要音频格式有MPEG-1/2、Audio Layer 1/2/3、Dolby Digital Audio、高级音频编码（Advanced Audio Coding,AAC）等。

该软件会显示SEI、序列参数集（Sequence Parameter Set,SPS）、图像参数集（Picture Parameter Set,PPS）、I/P/B Slice等信息。单击某帧可以查看详细信息，包括frame_num、slice_type等。

5. FFmpeg简介

5.1 FFmpeg

FFmpeg是一个跨平台的音视频处理库，是一套可以用来记录、转换数字音视频，并能将其转化为流的开源计算机程序，支持Windows、linux、Mac等。FFmpeg采用LGPL或GPL许可证，提供了录制、转换及流化音视频的完整解决方案，包含非常先进的音视频编解码库libavcodec。为了保证高可移植性和编解码质量，libavcodec中很多编解码算法都是全新开发的。

FFmpeg包括几个常用的模块库：

libavformat：用于各种音视频封装格式的生成和解析，包括获取解码所需信息以生成解码上下文结构。
libavcodec：用于各种类型音视频编解码。
libavutil：包含一些公共的工具函数。
libswscale：用于视频场景比例缩放、色彩映射转换等。
libpostproc：用于后期效果处理等。
libswresample：提供音频重采样功能，包括采样频率、声道格式等。
libavfilter：用于滤波器处理，如音视频倍速、水平翻转、叠加文字等功能。
libavdevice：包括输入/输出设备的库，实现音视频数据的抓取或渲染。

FFmpeg提供了3个命令行工具，如下所述：

（1）ffmpeg：编解码小工具，可用于格式转换、解码或电视卡即时编码等。

（2）ffserver：一个HTTP多媒体即时广播串流服务器。

（3）ffplay：一个简单的播放器，使用ffmpeg库解析和解码，通过SDL显示。

FFmpeg的开发分为两种：

直接使用所提供的这3个命令行工具进行多媒体处理。
使用封装的上述8个模块库进行二次开发。

5.2 FFmpeg命令行

FFmpeg提供的命令行功能非常强大，包括但不限于以下功能。

列出支持的格式。
剪切一段媒体文件。
提取一个视频文件中的音频文件。
从MP4文件中抽取视频流并可导出裸的H.264数据.
视频静音，即只保留视频，使用命令参数-an。
使用AAC音频数据和H.264视频生成MP4文件。
音频格式转换。
从WAV音频文件中导出PCM裸数据。
将一个Mp4文件转换为一个GIF动图。
将一组图片生成GIF动图。
淡入效果器使用。
淡出效果器使用。
将两路声音合并，例如加背景音乐。
为视频添加水印效果。
视频提亮效果器。
视频旋转效果器的使用。
视频裁剪效果器的使用。
将一段视频推送到流媒体服务上。
将流媒体服务器上的流下载并保存到本地计算机。
将两个音频文件以两路流的形式封装到一个文件中

注：更详细的参数可以去FFmpeg官网查询。ffmpeg Documentation

5.3 FFmpeg开发包

当前FFmpeg最新版本为5.0.2，包括静态库、动态库、开发者3个版本。

（1）Static(静态库版本)：其中只有3个应用程序，包括ffmpeg.exe、ffplay.exe、ffprobe.exe，每个exe应用程序的体积都很大，相关的dll文件已经被编译到exe程序中了，作为工具而言此版本最合适，不依赖动态库，为单个可运行程序。

（2）Shared(动态库版本)：其中除了3个应用程序fmpeg.exe、ffplay.exe、ffprobe.exe之外，还有一些动态dll文件，例如avcodec-54.dll之类的文件。Shared中的exe程序体积很小，它们在运行的时候，到相应的dll文件中调用功能。程序运行过程必须依赖于提供的dll文件，开发程序时必须下载该版本，因为只有该版本中有dll动态库，需要注意Dev(开发者版本)中不包含这些dll动态库。

（3）Dev(开发者版本)：该版本用于开发，其中包含了库文件xxx.lib及头文件xxx.h，这个版本不包含exe文件和dll文件。Dev版本中include文件夹内包含了所有头文件，lib文件夹中包含了所有编译开发所需要的库，但没有运行库，所以需要从Shared版本中获取。

最新的下载网址为 Releases · BtbN/FFmpeg-Builds · GitHub