语音处理
2022-07-17
这个作者很懒,什么都没留下…
展开
-
未来音频处理发展的趋势
未来音频处理发展的趋势:1)混合型编码器。结合当前一些先进的语音和音频编解码器。2)多通道编码。像PS,MPEG Surround3)交互式音频。像音视频会议中需要的音频编码技术等等原创 2011-01-06 20:57:00 · 1604 阅读 · 0 评论 -
matlab基础学习(4)
一、 两个列矢量的内积对于两个列矢量的内积的计算方法如下:xdoty = y' * x代码如下:>> x = [1,2,3,5]'x = 1 2 3 5>> y =[3,6,7,8]'y = 3 6 7 8>> xdoty = y'* xxdoty = 76原创 2012-11-17 18:11:09 · 2484 阅读 · 0 评论 -
matlab基础学习(2)之求多项式的根
在matlab中求多项式的根非常的简单,只要使用matlab内置的roots函数即可。例如:对于多项式p(x) = x^5 + 5 * x +7使用matlab求其根的代码代码:%多项式的系数存入矢量变量中p = [1 0 0 0 5 7]; %表示多项式p(x) = x^5 + 5 * x + 7format long; %打印双精度原创 2012-11-17 17:07:28 · 22473 阅读 · 0 评论 -
matlab基础学习(5)之映射和正交基
一、映射在matlab中,矢量y正交映射到矢量x上的定义如下:Px(y) = /(x^2)*x对于长度为N的列矢量y映射到长度为N的列矢量x上的计算方法如下:yx = (x' * y) * (x' * x) ^ (-1) * x更一般的, 长度为N的列矢量y映射到M维的子空间的 N x M的矩阵x,计算方法如下:yX = X * (X原创 2012-11-17 18:35:12 · 5498 阅读 · 0 评论 -
matlab基础学习(3)
一、复数的矢量解释对于复数z = 2 + i * 3,可以用矢量图来表示,代码如下:>> z = 2 + i * 3z = 2.00000000000000 + 3.00000000000000i>> xcoords = [origin(1) real(z)]xcoords = 0 2>> ycoords = [origin(2) imag(z原创 2012-11-17 17:32:41 · 2021 阅读 · 0 评论 -
多媒体之音视频中的概念
视频:一般来说,包括可视的运动图像(visual)和可闻的伴音(audio)两部分。其中伴音处于辅助地位。一、.数字音频是一种利用数字化手段对声音进行录制、存放、编辑、压缩和播放的技术。音频信号的保存:就是将这些音频信号电平转换为二进制数据存储起来,存入到音频文件中。音频信号的播放:就是把这些数据转换为模拟的电平信号再送到音频设备播放。对于数字音频还需要了解以下转载 2012-10-31 21:17:33 · 1017 阅读 · 0 评论 -
语谱图
语谱图:所谓语谱图就是语音频谱图,一般是通过处理接收的时域信号得到频谱图,因此只要有足够时间长度的时域信号就可以(时间长度为保证频率分辨率)。专业点讲,语谱图就是频谱分析视图,如果针对语音数据的话,叫语谱图,语谱图的横坐标是时间,纵坐标是频率,坐标点值为语音数据能量。采用二维平面来表达三维信息。所以能量值的大小通过颜色来表示。颜色深表示该点的语音能量越强。代码实现:原创 2011-11-06 20:08:00 · 8738 阅读 · 3 评论 -
分类概述
分类(classification)任务就是通过学习获得一个目标函数(Target Function)f,将每个属性集x映射到一个预先定义好的类标号y。分类任务的输入数据是记录的集合,每条记录也称为实例或者样例。用元组(X,y)表示,其中,X是属性集合,y是一个特殊的属性,指出样例的类标号。分类技术是一种根据输入数据集建立分类模型的系统方法。分类技术一般是用 一种学习算法确定分类模型,该模原创 2011-11-04 16:39:45 · 1348 阅读 · 0 评论 -
音频信号MATLAB处理的一些常用函数
<br />1 wavrecord():用来录制语音和音频信号。<br /> 例如:speech = wavrecord(16000, 8000, 1, 'double');<br /> 采样的样点放入speech变量中,16000是要采样的点数,8000是采样率<br /> 1表示是mono信号,<br /> <br />2 sound():用来播放语音和音频<br /> 例如:sound(speech,8000);<br /> 其中,spe原创 2011-03-17 18:55:00 · 9462 阅读 · 0 评论 -
Quadrature Mirror Filterbanks
<br />这篇论文主要讲述了两通道正交镜像滤波器组的原理进行了推导。<br /> <br />对于理解正交镜像滤波器组的原理不错。<br /> <br />公式推导很详细。<br /> <br />原创 2011-01-12 14:45:00 · 1028 阅读 · 0 评论 -
The CELT ultra-low delay audio codec
<br /><br />The CELT ultra-low delay audio codec<br />CELT编码器是一种用于音频的压缩算法。像MP3,Vorbis,和AAC一样适合传输音乐,且获得高质量的音质。不像其他形式,CELT占用很小的延时,甚至其延时比语音核心版式像Speex,GSM或G.729的都少。<br /> <br />在超低延时领域,没有确定的标准。<br />-G.722.1C(ITU-T):40ms delay up to 32kHz<br />-AAC-LD(MOEG):20原创 2011-01-11 11:31:00 · 2571 阅读 · 0 评论 -
Technologies for speech and audio coding
<br /><br />时域编码<br />当前大多数的语音编码方案是基于时域预测编码。尤其是CELP编码框架<br />频域编码<br />当前大多数的音频编码方案是基于频域编码的。通过利用非平衡的能量分布在频域获得有效的和自适应的量化噪声控制。这种非平衡性与音频信号的特性有关,像相邻的采样点之间有很强的相关性。编码过程中,最大程度的比特减少也是来自于相关性。在此之上,我们同时在频域利用人类感知特性,例如,掩蔽效应能极大的增强感知音频质量。对于变换,MDCT(修正离散余弦变换)非常重要,它能有效的获得信号原创 2011-01-10 15:26:00 · 1132 阅读 · 0 评论 -
能力很有限,差距很大,需要继续努力
看到某公司招聘高频音频工程师的要求竟然这么多:1)Excellent algorithm background about common DSP and multimedia functions/applications2)Solid knowledge/experience on the C/C++ and Assembly programming languages 3)Excel原创 2012-12-14 20:15:21 · 939 阅读 · 0 评论