数字信号处理理论算法与实现 里面的代码_看这篇,我才了解到语音算法工程师的就业方向...

本文作者分享了自己在语音信号处理领域的学习和工作经验,涵盖语音编解码、识别、合成、增强等领域,并探讨了相关行业和职业的发展方向。文章提到在嵌入式、集成电路和通信等行业中的应用,以及做标准研发、移植优化和产品应用等职业路径,强调了专业化和市场视野的重要性。
摘要由CSDN通过智能技术生成

文章转载自CSDN博客,点击文末的阅读原文了解详细信息。文章撰写于2009年,有些信息可做参考。


本人从研究生开始学习语音频信号处理到工作中实际的工程实践 , 至今已经七年多了 , 这跟  七年之痒  真的没有关系 , 主要是一方面最近比较空闲 , 有时间做些总结和规划 , 另一方面也是为准备从事这个职业或者正在从事这个职业的新手们提供一点参考 , 当然一家之言 , 欢迎大家交流讨论 , 尤其希望那些资深人士不吝指点 。

1 、涉及的方向

 1 )语音、音频编解码算法

     已经成熟地商业化、产品化,压缩码率和音质总是一对冤家,只有一些特殊的存储和通信应用会要求低码率,更多的是追求高品质的音质,例如高清音质。

  2 )语音识别算法

    做过一年半,初步了解识别率受多种因素影响,技术本身还需要在抗干扰等方面进一步发展,目前只有一些特殊场合的应用产品化,作为人机交互的大规模应用还有一段路要走。

3 )语音合成算法

   这个没有接触核心技术,不妄加评论,反正据说科大讯飞在这个方向非常强。

 4 )语音增强算法

   这个没有接触核心技术,感觉回声消除、降噪处理等还是很有用处。

 5 )语音信号分析

   主要一些特殊应用需求,如智能玩具、军工等。

6 )音频特征提取和检索

    音乐哼唱和音乐检索,以及音频的特殊应用。

7 )音效处理算法

    在 MP3 上非常普遍的音效处理算法,当然也有立体声环绕和多声道处理算法。

2 、涉及的行业

 1 )嵌入式、集成电路、芯片

       这个行业需要这个职业的一般,尤其是做多媒体芯片的,往往需要为芯片提供高品质的音视频算法 在低功耗、资源少的情况下保证音视频的最佳化应用。

2 )计算机软硬件

       这个行业里,可以做标准算法的研发,也可以做应用程序,或者是第三方软件开发。

3 )通信行业

       这个行业应该不多,一般音频编解码属于信源编码,而通信行业涉及的技术比较多,从天线的发送接收,基带芯片的解码,语音编解码,上下信道的控制等系统。

3 、涉及的职业

1 )做标准、第三方算法研发

      做音频算法的国际标准,如 ITU G.7xx 、宽带语音编码,或者第三方语音算法的研发,如语音识别、语音合成等。往往这样的职位需要硕士以上学历,对数字信号处理理论要求较高。

2 )做移植、优化

     在芯片公司为产品做音频算法的移植和优化,需要对芯片指令和算法本身有较强的理解。做嵌入式产品,就意味着在低成本、低功耗、资源少的情况下要具有足够的耐心去一点点优化算法,我曾经对 AMR-NB 中的码书搜索部分、 LSF 矢量量化部分进行至少 5 遍的代码优化,渐渐将所用的指令数减到最小化。每一遍过后都觉得没有再优化的地方了,然后静下心再分析算法原理、分析代码执行和指令特点,就有了新的发现。以至于后来流传着“优化无极限”,当然优化工作很可能是用较少的时间就优化了总量的 80% ,但剩下的 20% 需要付出更多的时间,全凭项目的需求来权衡了,积累一定的经验很重要。

3 )做产品应用

     做一般多媒体软件的应用开发,涉及语音频本身的理论较少,更多的是计算机技术。

4 、优缺点

做语音频算法职业的缺点是  少 ”, 相关的公司少,专业对口的职业少,做这个职业的人也少 , 发展机会少一点,当然这个“少”也是不同时期,不同职业之间的相对比较而言的。优点自然是竞争压力相对小些,工作相对稳定。

5 、三点总结

我一路走来,犯了许多错误,但是塞翁失马,焉知非福?

1)  杂而不专

“专”是指专注在一个方向上的技术和业务积累。

我刚开始的时候,一段时间看看语音频编解码,一段时间看看静态图像处理技术,一边研究计算机网络技术,一边了解一下视频压缩算法,今天搞搞写写 Window 程序,明天去焊焊电路。典型的学的杂,但是哪个都浅尝辄止,最后想想哪个都拿不出手,感觉就是样样行,样样都很肤浅。

2)  专而不精

“精”是指在一个方向上达到精通的水平(技术方面)和高效的业务能力(项目管理方面)。

工作了一段时间,比较清楚自己的兴趣和特长,于是静下心尽量把范围缩小,主要集中在语音频编解码上,但是有时还要根据实际项目需求去做其它方向的。另外,如果项目时程紧张的话,技术方面如果不经过深加工,积累的经验还是很少。我目前正处于这个阶段,需要坚实的理论基础以便深入算法(算法层面)和不断的总结项目经验教训(工程实现方面)来提高自己。

3)  精而不广

“广”是指见识要广,具有行业思维、市场化的眼光。

身处在这个赖以谋生的行业,自然要关心一下它的动态发展,我们在技术上要深挖一口井,但眼界上却不要做一个井底之蛙!

最后,谈一下工作态度,我自认为资质平庸,还是踏踏实实做事,认认真真做人。不要盲目和别人攀比,产生不良的心态,影响日常的工作和生活。对于那些比我强的人,我是这样看的:客观上,他们一定有我们不具有的能力,这里的能力是指综合评价得到的,包括智商(学习能力、技术深度广度、创新思维等)、情商(人脉关系、成长环境、习惯等);主观上,每个人都有自己的人生轨迹,苦辣酸甜只有自己知道,平衡好自己生活的各个方面才是最好的。

你的工作内容是什么,点我给我留言交流呀!

0647d4b899ba9fd407cdd524c6855194.png

数字信号处理理论算法实现》是2003年清华大学出版社出版的图书,作者是胡广书。绪论 O.1数字信号处理理论 O.2数字信号处理实现 0.3数字信号处理的应用 O.4关于数字信号处理的学习 参考文献 上篇经典数字信号处理 第1章离散时间信号与离散时间系统 1.1离散时间信号的基本概念 1.1.1离散信号概述 1.1.2典型离散信号 1.1.3离散信号的运算 1.1.4关于离散正弦信号的周期 1.2信号的分类 1.3噪声 1.4信号空间的基本概念 1.5离散时间系统的基本概念 1.6LSI系统的输入输出关系 1.7LSI系统的频率响应 1.8确定性信号的相关函数 1.8.1相关函数的定义 1.8.2相关函数和线性卷积的关系 1.8.3相关函数的性质 1.8.4相关函数的应用 1.9关于MATLAB 1.10与本章内容有关的MATLAB文件 小结 习题与上机练习 参考文献 第2章Z变及离散时间系统分析 2.1Z变的定义 2.2Z变的收敛域 2.3Z变的性质 2.4逆Z变 2.4.1幂级数法 2.4.2部分分式法 2.4.3留数法 2.5LSI系统的转移函数 2.5.1转移函数的定义 2.5.2离散系统的极零分析 2.5.3滤波的基本概念 2.6IIR系统的信号流图与结构 2.6.1IIR系统的信号流图 2.6.2IIR系统的直接实现 2.6.3IIR系统的级联实现 2.6.4IIR系统的并联实现 2.7用z变求解差分方程 2.8与本章内容有关的MATLAB文件 小结 习题与上机练习 参考文献 第3章信号的傅里叶变 3.1连续时间信号的傅里叶变 3.1.1连续周期信号的傅里叶级数 3.1.2连续非周期信号的傅里叶变 3.1.3傅里叶级数和傅里叶变的区别与联系 …… 下篇统计数字信号处理 附录 索引
本书是在宗孔德教授与本人合著的《数字信号处理》一书的基础上重新编著而成的。 《数字信号处理》一书于1988年由清华大学出版社出版后,已发行19000册,并于1991年由台湾儒林图书有限公司在台湾出版发行。随着数字信号处理这一新学科的飞速发展及教学的需要,我们决定将原书修订为两本,一本是供研究生教学使用的教材,另一本是供本科生教学使用的教材。前者篇幅较大,希望尽可能多的包含信号处理的新内容、新进展,后者篇幅稍小,偏重于基本要求。宗孔德教授提议再版后的这两本著作由我们两人分别完成。并决定前者由我编写,后者由他来完成。现在奉献给读者面前的这本书即是笔者在宗孔德教授的鼓励与支持之下完成的。 本书共有14章,大致可以分为五个部分。第1至第4章为第一部分,它包括了离散信号和离散系统分析的基本理论,是学习和应用数字信号处理的基础篇。第4章介绍了近20年来提出的其它形式的变技术,它们在信号处理中的地位越来越重要。特别是离散余弦变,由于其良好的性质已被人们广为研究与应用。 第5章是本书的第二部分,该章篇幅较大,包含了近30年来所提出的有关DFT及卷积计算的主要方法。除了经典的Cooley\|Tukey算法之外,还介绍了被公认为较好的分裂基算法,输入、输出点数不相同的DFT快速算法(Pruning, CZT)。最后简要介绍了Winograd快速算法的主要思路及快速余弦变等。 第6至第9章是本书的第三部分。这一部分主要讨论离散系统的分析与综合问题。在第6章,首先讨论了离散时间系统的相位问题,简要介绍了全通系统及最小相位系统的基本定义与性质;讨论了在语音分析与谱估计中应用很广的Lattice结构;作为系统分析的一个重要工具——状态变量法,也在此处给以介绍。读者可以看到,这一章的大部分内容是第2章内容的延续。第7章从便于计算机编程的角度来讨论IIR滤波器的设计问题,力求避开繁琐的频率变问题,以便于理解和应用。第8章为FIR滤波器的设计问题,也是从便于编程和应用的角度来讨论。第9章介绍一些具有特殊形式或特殊要求的滤波器,主要是三种不同形式的简单整系数滤波器,差分器及抽样率转滤波器,后者实际上是多抽样率信号处理问题。 第10至第13章是本书的第四部分。第10章主要讨论了平稳随机信号的定义、性质、描述及通过线性系统的行为。第11章主要讨论经典功率谱估计问题,包括了自相关函数的估计,谱估计的周期图法与自相关法,讨论了估计的性能及改进方法。第12章讨论了现代谱估计的主要内容,即参数模型法,包括了AR,MA及ARMA模型,同时也简要介绍了非参数模型法,如最小方差方法,基于特征值分解的谱估计方法。第12章及第13章的时\|频分布都是近20年来信号处理学科中最为活跃的内容。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值