音频算法工程师发展前景

本人从研究生开始学习语音频信号处理到工作中实际的工程实践 , 至今已经七年多了 , 这跟 七年之痒 真的没有关系 , 主要是一方面最近比较空闲 , 有时间做些总结和规划 , 另一方面也是为准备从事这个职业或者正在从事这个职业的新手们提供一点参考 , 当然一家之言 , 欢迎大家交流讨论 , 尤其希望那些资深人士不吝指点 .

 

1 、涉及的方向

       1 )语音、音频编解码算法

              已经成熟地商业化、产品化,压缩码率和音质总是一对冤家,只有一些特殊的存储和通信应用会要求低码率,更多的是追求高品质的音质,例如高清音质。

       2 )语音识别算法

              做过一年半,初步了解识别率受多种因素影响,技术本身还需要在抗干扰等方面进一步发展,目前只有一些特殊场合的应用产品化,作为人机交互的大规模应用还有一段路要走。

       3 )语音合成算法

              这个没有接触核心技术,不妄加评论,反正据说科大讯飞在这个方向非常强。

       4 )语音增强算法

              这个没有接触核心技术,感觉回声消除、降噪处理等还是很有用处。

       5 )语音信号分析

              主要一些特殊应用需求,如智能玩具、军工等。

       6 )音频特征提取和检索

              音乐哼唱和音乐检索,以及音频的特殊应用。

       7 )音效处理算法

              MP3 上非常普遍的音效处理算法,当然也有立体声环绕和多声道处理算法。

2 、涉及的行业

       1 )嵌入式、集成电路、芯片

              这个行业需要这个职业的一般,尤其是做多媒体芯片的,往往需要为芯片提供高品质的音视频算法 . 在低功耗、资源少的情况下保证音视频的最佳化应用。

       2 )计算机软硬件

              这个行业里,可以做标准算法的研发,也可以做应用程序,或者是第三方软件开发。

       3 )通信行业

              这个行业应该不多,一般音频编解码属于信源编码,而通信行业涉及的技术比较多,从天线的发送接收,基带芯片的解码,语音编解码,上下信道的控制等系统。

3 、涉及的职业

       1 )做标准、第三方算法研发

              做音频算法的国际标准,如 ITU G.7xx 、宽带语音编码,或者第三方语音算法的研发,如语音识别、语音合成等。往往这样的职位需要硕士以上学历,对数字信号处理理论要求较高。

       2 )做移植、优化

              在芯片公司为产品做音频算法的移植和优化,需要对芯片指令和算法本身有较强的理解。做嵌入式产品,就意味着在低成本、低功耗、资源少的情况下要具有足够的耐心去一点点优化算法,我曾经对 AMR-NB 中的码书搜索部分、 LSF 矢量量化部分进行至少 5 遍的代码优化,渐渐将所用的指令数减到最小化。每一遍过后都觉得没有再优化的地方了,然后静下心再分析算法原理、分析代码执行和指令特点,就有了新的发现。以至于后来流传着“优化无极限”,当然优化工作很可能是用较少的时间就优化了总量的 80% ,但剩下的 20% 需要付出更多的时间,全凭项目的需求来权衡了,积累一定的经验很重要。

       3 )做产品应用

              做一般多媒体软件的应用开发,涉及语音频本身的理论较少,更多的是计算机技术。

4 、优缺点

做语音频算法职业的缺点是 ”, 相关的公司少,专业对口的职业少,做这个职业的人也少 , 发展机会少一点,当然这个“少”也是不同时期,不同职业之间的相对比较而言的。优点自然是竞争压力相对小些,工作相对稳定。

 

5 、三点总结

   我一路走来,犯了许多错误,但是塞翁失马,焉知非福?

1)  杂而不专

“专”是指专注在一个方向上的技术和业务积累。

我刚开始的时候,一段时间看看语音频编解码,一段时间看看静态图像处理技术,一边研究计算机网络技术,一边了解一下视频压缩算法,今天搞搞写写 Window 程序,明天去焊焊电路。典型的学的杂,但是哪个都浅尝辄止,最后想想哪个都拿不出手,感觉就是样样行,样样都很肤浅。

2)  专而不精

“精”是指在一个方向上达到精通的水平(技术方面)和高效的业务能力(项目管理方面)。

工作了一段时间,比较清楚自己的兴趣和特长,于是静下心尽量把范围缩小,主要集中在语音频编解码上,但是有时还要根据实际项目需求去做其它方向的。另外,如果项目时程紧张的话,技术方面如果不经过深加工,积累的经验还是很少。我目前正处于这个阶段,需要坚实的理论基础以便深入算法(算法层面)和不断的总结项目经验教训(工程实现方面)来提高自己。

3)  精而不广

“广”是指见识要广,具有行业思维、市场化的眼光。

身处在这个赖以谋生的行业,自然要关心一下它的动态发展,我们在技术上要深挖一口井,但眼界上却不要做一个井底之蛙!

 

最后,谈一下工作态度,我自认为资质平庸,还是踏踏实实做事,认认真真做人。不要盲目和别人攀比,产生不良的心态,影响日常的工作和生活。对于那些比我强的人,我是这样看的:客观上,他们一定有我们不具有的能力,这里的能力是指综合评价得到的,包括智商(学习能力、技术深度广度、创新思维等)、情商(人脉关系、成长环境、习惯等);主观上,每个人都有自己的人生轨迹,苦辣酸甜只有自己知道,平衡好自己生活的各个方面才是最好的。

 

  • 4
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值