语音编解码
文章平均质量分 88
那年晴天
汽车行业
展开
-
PCM数据格式
1. 音频简介 经常见到这样的描述: 44100HZ 16bit stereo 或者 22050HZ 8bit mono 等等. 44100HZ 16bit stereo: 每秒钟有 44100 次采样, 采样数据用 16 位(2字节)记录, 双声道(立体声); 22050HZ 8bit mono: 每秒钟有 22050 次采样, 采转载 2017-05-02 13:30:50 · 1071 阅读 · 0 评论 -
研究音频编解码要看什么书
前言。。。。。。最近总是有人问研究音频编解码要看什么书其实这是一个很难回答的问题,原因有很多。首先,做工程首先一个问题就是和课本学习不同,不是看书能解决的。其次,音频编解码技术在国内研究的人很少包括总体的音频技术国内相对国外都研究的不多。(从中国的潜艇噪声技术一直解决不好就能看出一二)。第三,音频编解码技术是一种应用,而一般的书籍都是理论基础。只看理转载 2017-11-07 11:39:45 · 518 阅读 · 0 评论 -
关于缓冲区的一点总结
一般来说,创建缓存区的同时,会有多个线程操作这个缓存区,一边往缓存区中塞数据,一边从缓存区中取数据。不过,还缺少一点,就是对缓存区的保护。自己曾经遇到这种情况,往缓存区塞数据的速度过快,导致创建的缓存区数据溢出,出现 stack overflow的错误。所以,一定要对缓存区做保护。不过,还是要做区别的。1.如果自己要做实时的情况,要做一些判断,当超过一定时间,需要清除缓存区中的一些数据,来原创 2017-11-06 20:16:57 · 1286 阅读 · 0 评论 -
音频编解码中关于转码以及播放的总结
自己最近一直做关于音频编解码,播放以及转码的东西。总结一下关于这方面的知识。先说关于播放的问题,大致步骤是:FFMPEG音频解码=>SDL进行播放pcm数据。在这里遇到的问题:1.解码的时候,文件格式不对,不是S16的格式,之后使用ffmpeg中重采样模块来操作,成功播放;2.一般来说,网络上下载的音频文件采样率一般都是44100的,解码后的数据采样率也必须是44100,否则播放会失败。进行解原创 2017-10-09 22:41:23 · 2229 阅读 · 0 评论 -
音视频封装格式、编码格式知识
常见的AVI、RMVB、MKV、ASF、WMV、MP4、3GP、FLV等文件其实只能算是一种封装标准。一个完整的视频文件是由音频和视频2部分组成的。H264、Xvid等就是视频编码格式,MP3、AAC等就是音频编码格式。例如:将一个Xvid视频编码文件和一个MP3音频编码文件按AVI封装标准封装以后,就得到一个AVI后缀的视频文件,这个就是我们常见的AVI视频文件了。由于很多种视频编码转载 2017-10-09 10:04:35 · 465 阅读 · 0 评论 -
各种音频编码方式的对比
内容简介:文章介绍了PCM编码、WMA编码、ADPCM编码、LPC编码、MP3编码、AAC编码、CELP编码等,包括优缺点对比和主要应用领域。PCM编码(原始数字音频信号流)类型:Audio制定者:ITU-T所需频宽:1411.2 Kbps特性:音源信息完整,但冗余度过大优点:音源信息保存完整,音质好缺点:信息量大,体积大,冗余度过大应用领域:voip版税方转载 2017-08-30 13:34:12 · 10623 阅读 · 0 评论 -
I can play many sound at the same time but I can't record any sound using arecord
这个是linux下解决alsa驱动只能播放声音,不能采集声音的问题。配置dmix之后,是可以进行混音播放的,可是采集添加上采集的时候,出现问题:I can play many sound at the same time but I can't record any sound using arecord。https://forums.gentoo.org/viewtopic.php?原创 2017-08-30 10:26:23 · 685 阅读 · 0 评论 -
g729编解码的总结(2)
自己的g729代码在测试的时候,出现了错误,是自己以前没注意的地方,所以,要明白一点:只要是没解决的问题,就不是小问题。自己修改了很多程序,可是老是通不过,自己最后才想到修改源码,然后成功了。下面是自己的源码,希望对大家有帮助吧。int CG729aDec::G729aDec_Init(void){ for (Word16 i = 0; i < M; i++) { m_synth原创 2017-06-19 20:53:24 · 1974 阅读 · 2 评论 -
一个linux 混音播放的 /etc/asound.conf 配置
备用。只有相同用户才能实现设备的同时打开。pcm.!dmix {type dmixipc_key 5678293ipc_key_add_uid yesslave {pcm "hw:0,0"period_time 0period_size 2048buffer_size 16384format S16_LErate 48000}}pcm转载 2017-06-07 20:13:25 · 2471 阅读 · 1 评论 -
[整理]语音编码G.711, G.729
1. 语音编码分类 (1)波形编码: 以逼近声音波形为目标,其代表算法有G.711,其声音清楚度好,语音的自然度高,但是压缩效率比较差,常在32kbps以上。 (2)参数编码: 将人的声道抽象成一个发声模型,对这个模型的参数进行编码,其特点是压缩效率高,但是自然度比较差,能够以极低速率进行编码。 (3)波形参数混合编码: 结合了波形编码和参数编码的优点,代表算法有G.723转载 2017-05-17 19:28:03 · 4213 阅读 · 0 评论 -
g723编解码之自我总结
其实,很多关于编解码的音视频例子,都是通过文件来进行操作的。自己做过的(ffmpeg视频编解码、g726编解码、g723编解码)都是从网上找的例子来进行修改的。其中,最难的地方就是在于把文件读取改为缓存读取。需要编解码的音视频流,都是通过回调函数回调上来的,一般有用的是两个参数:指针和流的大小长度。这里总结一下g723的方法。g723是通过读取一个字节,而不是通过读取流的一定长度,来进原创 2017-05-15 19:41:40 · 3336 阅读 · 1 评论 -
PCM 音频格式分析
PCM文件:模拟音频信号经模数转换(A/D变换)直接形成的二进制序列,该文件没有附加的文件头和文件结束标志。Windows的Convert工具可以把PCM音频格式的文件转换成Microsoft的WAV格式的文件。 将音频数字化,其实就是将声音数字化。最常见的方式是透过脉冲编码调制PCM(Pulse Code Modulation) 。运作原理如下。首先我们考转载 2017-05-05 09:58:41 · 10057 阅读 · 0 评论 -
g729编解码的总结
关于音频编解码这一块的内容,感觉就g729这个算法麻烦一点。在网上查找资料关于g729有很多内容,大致也了解了一下。g729算法算是一个类,里面细分还有很多具体的东西,在ITU官网上下载的g729包里面,有各种各样的:g729a、g729b、g729c等等,自己实在是不知道该使用哪一个,仔细阅读了文档以后,才发现,g729a是适合自己的。具体来说,每个都实现的功能不同,有的算法中提供了关于码率原创 2017-05-18 20:20:57 · 20464 阅读 · 10 评论 -
YV12 and NV12
用videoCapture和IAMStreamConfig拿到的支持的格式列表。发现支持2中图像格式,YV12和NV12。具体是怎么样的内存分布不知道。查了些文档。自己修改了几个图。看出了点端倪YV12先看看 http://www.fourcc.org/yuv.php 上比较标准的定义:YV12This is the format of choice for man转载 2017-05-03 16:42:20 · 445 阅读 · 0 评论 -
g726算法的一些总结
在网上有很多关于g726算法的编解码,我做的是pcm和g726之间互相转码。自己对音频的编解码了解的不多,做一下记录吧。我在网上下载的很多pcm文件,经过测试,采样都是8000HZ,这个和自己所想的倒是不同的,这歌参数要是设置不对,是不能播放pcm出来的。自己进行编译的时候,pcm进行过编解码后,生成的pcm文件质量是很好的,可是中间生成的g726文件的质量不是很好,有杂音,不过能听清原创 2017-05-10 21:07:35 · 2805 阅读 · 0 评论 -
语音编码标准(G.711 G.723 G.726 G.729 iLBC)
各种各样的编解码在各种领域得到广泛的应用,下面就把各种codec的压缩率进行一下比较。现主要有的speech codec 有: G.711, G.723, G.726 , G.729, ILBC, QCELP, EVRC, AMR, SMV主要的audio codec 有: real audio, AAC, AC3, MP3, WMA, SBC等 各种转载 2017-11-16 11:48:37 · 6467 阅读 · 0 评论