C++的新手,自从搞了算法和kaldi开始着手C++,所以有很多坑没有趟过。最近需要把手头的matlab程序转化成C++,其中涉及到读取wav音频文件的部分,着实头疼,所以上网搜了一下,并且自己进行了尝试和改写,写了自己的一个版本,在这里主要记录一下其中遇到的教训和经验理解。
首先在做这个问题之前,确保你自己知道,你的wav文件的采样率和位数,我这里以最普遍的16k和16bit的wav文件来说明。有很大一部分人在想:我直接用二进制流暴力的读取不行吗,怎么那么多说道。同学这个思想是好的,不过有偏差。不知道你玩没玩过auditon,即使没玩过也应该听过cool edit,两款音频编辑软件。你往里面扔wav,mp3等格式的文件的时候,他什么都不会问你,自己就知道采样率和位数声道数等。而如果你扔进去pcm格式的音频的时候,他会问这问那,下面是Adobe audition的截图:
那么你会想为什么呢?同样的两种文件为什么一个他啥都知道,一个他啥都不知道呢?仔细想不难想出:wav(mp3)等文件里面有某种标识的部分,并且已经成为了某种标准,所以按照某种解码去解读就能获取相关内容。而pcm什么都没有。那么很明显了,wav里面含有标识位,在没