█ 【安卓学习之MP3】 MP3读取格式
█ 系列文章目录
提示:这里是收集了和音频有关的文章
- 【安卓学习之MP3】 MP3读取格式
- 【安卓学习之第三方库】 ZlwAudioRecorder学习:内部流程
- 【安卓学习之开源项目】 ParrotTongue:文字转语音(含LeLeTextToVoice、TextToMp3项目)
█ 文章目录
█ 读前说明
- 本文通过学习别人写demo,学习一些课件,参考一些博客,’学习相关知识,如果涉及侵权请告知
- 本文只简单罗列相关的代码实现过程
- 涉及到的逻辑以及说明也只是简单介绍,主要当做笔记,了解过程而已
█ 免费下载音乐网站(可能随时失效)
█ MP3文件
MP3文件大体上分为三个部分:TAG_V2(ID3V2),Frame(音频数据), TAG_V1(ID3V1)
ID3V2 | 包含了作者,作曲,专辑等信息,长度不固定,扩展了ID3V1的信息量 |
---|---|
Frame | 一系列的帧,个数有文件大小和帧长决定 每个FRAM的长度可能不固定,也可能固定,由位率bitrate决定 每个FRAME由分为帧头和数据实体两部分 帧头记录了mp3的位率,采样率,版本等信息,每个帧之间相互独立 |
ID3V1 | 包含了作者,作曲,专辑等信息,长度为128BYTE |
█ MP3分析
年少有为4m39s.mp3 分析:
所有的Mp3文件的数据帧开始的两个字节必需是“FF FA”或者 “FF FB”?
如果我将上面的mp3(16位立体声,采样率 44100Hz)通过【Cool Edit Pro 2.1】软件转换成8kHz后:
音频数据
█ 怎么读取一帧信息
怎么读取一帧信息
//获取解码器[输入缓冲区/输入数据]的ByteBuffer[序号](等待获取缓存区 会阻塞)
int inputBufferIndex = mediaCodec.dequeueInputBuffer(DecodeEngine.TimeOut_Us_In);// 0-1-2-3-0-1-2-3循环
if (inputBufferIndex >= 0) {
//当前解码器处理输入数据的ByteBuffer
ByteBuffer sourceBuffer = inputBuffers[inputBufferIndex];// 当前帧的数据
// 读取当前帧的数据,<0说明已经完成了读取操作
int sampleDataSize = mediaExtractor.readSampleData(sourceBuffer, 0);
if (sampleDataSize < 0) {// 结束,传递 end-of-stream 标志
mediaCodec.queueInputBuffer(inputBufferIndex, 0, 0, 0, MediaCodec.BUFFER_FLAG_END_OF_STREAM);
} else {
// ################################################
byte[] head = new byte[4];// 每一帧的帧头32字节
for (int i = 0; i < 4; i++) {
try {
head[i] = sourceBuffer.get(i);
} catch (Exception e) {
e.printStackTrace();
}
}
// ################################################
presentationTimeUs = mediaExtractor.getSampleTime();// 记录当前时间戳
//插入一帧待解码的数据:将当前ByteBuffer重新加入到队列中交给 MediaCodec 去解码
mediaCodec.queueInputBuffer(inputBufferIndex, 0, sampleDataSize, presentationTimeUs, 0);
mediaExtractor.advance();// 进入下一帧
byte[] head2 = new byte[4];
for (int i = 0; i < 4; i++) {
try {
head2[i] = sourceBuffer.get(i);
} catch (Exception e) {
e.printStackTrace();
}
}
Log.e("########222", inputBufferIndex + ";" + head2);
}
}
█ 自己的录音文件(了解这些信息,便于发送音频数据):
⚡️ 1.自己录制了个16KHZ采样率,8bit音频(8kbps):
我们发现,第一帧开始就是音频数据,没有文件头,这种编码方式为CBR,(带文件头的是VBR编码,可变位率),固定位率,每帧的大小一样(以下文件,可以看出长度为4*9=36个字节)
文件分析:
帧同步 | 1111 1111 111 | 11个1 |
---|---|---|
MPEG音频版本 | 10 | MPEG 2 |
Layer 描述 | 01 | Layer Ⅲ |
校验位 | 1 | 没有校验 |
位率/比特率 | 0001 | 8kbps |
采样率 | 10 | 16000Hz |
填充位 | 00 | 没填充(后面计算帧大小,会用到) |
声道 | 11 | 单声道 |
计算帧长度
帧大小(即每帧采样数) 表示一帧中采样的个数,这是恒定值,改MP3文件的采样数为576
帧长度是压缩时每一帧的长度,包括帧头。帧头为32bit,即4个字节
帧长度(字节)= | (( 每帧采样数 / 8 * 比特率 ) / 采样频率 ) + 填充 |
---|---|
= | (( 576 / 8 * 8) / 16 ) + 0 |
= | 36 |
每帧持续时间(毫秒) | = 每帧采样数 / 采样频率 * 1000 |
---|---|
= 576 / 16000 * 1000 | |
= 36 |
因此在实现上,两帧音频的发送的时间需要间隔36ms(帧头间隔时间)
⚡️ 2.自己录制了个16KHZ采样率,16bit音频(16kbps):
以下文件,可以看出长度为4*18=72个字节
帧同步 | 1111 1111 111 | 11个1 |
---|---|---|
MPEG音频版本 | 10 | MPEG 2 |
Layer 描述 | 01 | Layer Ⅲ |
校验位 | 1 | 没有校验 |
位率/比特率 | 0011 | 16kbps |
采样率 | 10 | 16000Hz |
填充位 | 00 | 没填充(后面计算帧大小,会用到) |
声道 | 11 | 单声道 |
帧大小(即每帧采样数) | MPEG 2 - Layer Ⅲ | 576 |
---|
帧长度(字节)= | (( 每帧采样数 / 8 * 比特率 ) / 采样频率 ) + 填充 |
---|---|
= | (( 576 / 8 * 16) / 16 ) + 0 |
= | 72 |
每帧持续时间(毫秒) | = 每帧采样数 / 采样频率 * 1000 |
---|---|
= 576 / 16000 * 1000 | |
= 36 |
因此在实现上,两帧音频的发送的时间需要间隔36ms(帧头间隔时间)
⚡️ 3.自己录制了个16KHZ采样率,32bit音频:
以下文件,可以看出长度为4*36=144个字节
帧同步 | 1111 1111 111 | 11个1 |
---|---|---|
MPEG音频版本 | 10 | MPEG 2 |
Layer 描述 | 01 | Layer Ⅲ |
校验位 | 1 | 没有校验 |
位率/比特率 | 0100 | 32kbps |
采样率 | 10 | 16000Hz |
填充位 | 00 | 没填充(后面计算帧大小,会用到) |
声道 | 11 | 单声道 |
帧大小(即每帧采样数) | MPEG 2 - Layer Ⅲ | 576 |
---|
帧长度(字节)= | (( 每帧采样数 / 8 * 比特率 ) / 采样频率 ) + 填充 |
---|---|
= | (( 576 / 8 * 32) / 16 ) + 0 |
= | 144 |
每帧持续时间(毫秒) | = 每帧采样数 / 采样频率 * 1000 |
---|---|
= 576 / 16000 * 1000 | |
= 36 |
因此在实现上,两帧音频的发送的时间需要间隔36ms(帧头间隔时间)
⚡️ 4.网上下载了个16KHZ采样率,32bit音频:
以下文件,可以看出长度为4*36=144个字节
帧同步 | 1111 1111 111 | 11个1 |
---|---|---|
MPEG音频版本 | 10 | MPEG 2 |
Layer 描述 | 01 | Layer Ⅲ |
校验位 | 1 | 没有校验 |
位率/比特率 | 0100 | 32kbps |
采样率 | 10 | 16000Hz |
填充位 | 00 | 没填充(后面计算帧大小,会用到) |
声道 | 11 | 单声道 |
帧大小(即每帧采样数) | MPEG 2 - Layer Ⅲ | 576 |
---|
帧长度(字节)= | (( 每帧采样数 / 8 * 比特率 ) / 采样频率 ) + 填充 |
---|---|
= | (( 576 / 8 * 32) / 16 ) + 0 |
= | 144 |
每帧持续时间(毫秒) | = 每帧采样数 / 采样频率 * 1000 |
---|---|
= 576 / 16000 * 1000 | |
= 36 |
因此在实现上,两帧音频的发送的时间需要间隔36ms(帧头间隔时间)
█ 采样率和比特率
采样率(采样频率)和比特率(位速率/位率/取样率/码率)就像是坐标轴上的横纵坐标。
横坐标的采样率表示了每秒钟的采样次数。单位Hz。英文名:Sampling rate
纵坐标的比特率表示了用数字量来量化模拟量的时候的精度。单位kbps。英文名:Bit rate
█ 其他:串口波特率修改
█ 相关资料
提示:这里是参考的相关文章
- 2019-01-15 音频格式简介和PCM转换成WAV_lidongxiu0714-CSDN博客_pcm转wav
- 重点文章 2018-01-12 android音频编辑之音频转换PCM与WAV_hesong的专栏-CSDN博客_android mp3转pcm
- 2017-07-25 android 音频解码之MediaCodec硬解码及音频重采样 - zhuhao - 博客园
- 2020-05-25 ffmpeg简单分析系列----音频(audio)_hijunmeng的专栏-CSDN博客
- 2020-06-30 Java pcm格式的音频实现8位和16位互转_fycghy0803的专栏-CSDN博客
- 2020-04-22 Android音视频系列(七):PCM音频单声道与双声道的相互转换_珠穆朗玛小王子的博客-CSDN博客_xobvlrlh单双转换法
- 2018.08.09 Android音频开发(4):PCM转WAV格式音频 - 简书
- 2018-03-16 Mp3帧分析(数据帧)_余松的博客-CSDN博客_mp3帧格式
- 2020-07-27 Android 音视频编解码(二) – MediaCodec 解码(同步和异步)_夏至的稻穗的博客-CSDN博客
- Cool edit pro 2.1简体中文汉化版下载 - 软件学堂
- windowsXP录音机程序sndrec32下载绿色免费版-西西软件下载
- GitHub - ZLYang110/FileSelector: Android 文件选择器,指定选择文件夹还是文件,根据后缀名过滤,支持多选
- Test/AudioEdit -DecodeEngine at master · gujianhesong/Test · GitHub
- GitHub - zhaolewei/ZlwAudioRecorder: AudioRecorder: Android 录音及录音可视化相关lib,支持pcm、wav、mp3音频的录制
- ComposeAudio/Constant.java at master · caizhili/ComposeAudio · GitHub
- 重置采样率
- 2021-05-04 angel Android技术迷-Android音视频开发图解
- 2016-06-27 Text To Speech 总结_Moscoper的博客-CSDN博客
- Android使用TextToSpeech实现语音播报-及默认不支持中文的方案_lanrenxiaowen的博客-CSDN博客_android texttospeech
- Android 音频播放之SoundPool的使用和封装_JavAndroid-CSDN博客_android soundpool 封装
- 文字合成语音TextToSpeech语音解决中文不能用问题_ljp的博客-CSDN博客_texttospeech 中文
- 科大讯飞语音引擎3.0下载-科大讯飞引擎3.0apk下载v3.0 安卓版-绿色资源网
- android音频编辑之音频转换PCM与WAV - 简书
- fghjhuang/WifiRealTimeSpeeker: android wifi voice chat base on speex;基于speex pcm音频流处理的安卓项目
- W-x1997/SmartButler: smartBulter是一款生活工具类app,机器人语言聊天(科大讯飞TTs引擎); 百度地图的定位集成(百度SDK);手机号码归属地查询(聚合数据);微信精选浏览;快递查询,图片的网络加载(Picasso),Revolly网络请求。
- 重点文章:2017-10-12 MP3格式音频文件结构解析 - nigaopeng - 博客园
█ 免责声明
博主分享的所有文章内容,部分参考网上教程,引用大神高论,部分亲身实践,记下笔录,内容可能存在诸多不实之处,还望海涵,本内容仅供学习研究使用,切勿用于商业用途,若您是部分内容的作者,不喜欢此内容被分享出来,可联系博主说明相关情况通知删除,感谢您的理解与支持! |
---|
提示:转载请注明出处:
https://blog.csdn.net/ljb568838953/article/details/118109265