How can I extract the audio data only out into memory,without actually running it through a decompressor?
如果不对其进行解压缩,则无法提取音频数据 – 它已被压缩!但是,如果您只想要原始压缩流,请继续阅读!
典型的mp3音频文件将分为几个部分:
[很可能是Metatag]
[可能的垃圾]
[可能的XING / LAME标签[可能更多垃圾]]
[mp3音频帧]
[可能元标记]
可能是Metatag:大多数mp3音频文件都有一个id3标签.请注意,某些用户可能会使用不同的标记格式标记其mp3文件,例如APE,因此您也需要考虑这一点.
可能的垃圾:一些mp3音频文件已被标记,重新标记和转换,因此Metatag标头可能无法为第一个音频帧提供准确的偏移,因为之前标签的残留可能会留下. foobar2000有一个选项来解决这个问题.
可能的XING / LAME标签:这些标签包含在mp3音频帧中,但它们不包含实际音频. madplay有代码向您展示如何读取和解析这些帧. XING / LAME标头可能有帧数,因此值得解析这些标头.同样,如果文件已经通过许多不同的标记器和编辑器,则可能存在几个格式错误,无效的音频帧.
MP3音频帧:实际的压缩流,分为“帧”.每帧将以同步位模式0xFFE开始.
可能的元标记:在文件末尾找到更多的元标记并不罕见. id3v1,APE,歌词都可以在这里找到.
要查找音频帧偏移量,您需要解析任何元标记头,然后开始寻找同步位模式.您不能只从文件的开头开始查找同步模式,因为并非所有标记都正确支持unsynchronization,因此元标记本身可能包含0xFFE模式.
一旦你有第一个音频帧的偏移量,你应该查看文件的末尾并计算有多少非音频数据,以便你知道何时停止解析音频.一旦你有音频数据开头的偏移量和音频数据末尾的偏移量,你就可以通过你的散列/校验和函数传递音频数据了!