我的第一篇博客

语音

人工智能----语音

本人正式入坑人工智能语音方向,想记录一下从一个小白开始学习人工智能的经历,其中遇到的问题还有总结的内容就总结在之后的博客里,希望能够一起讨论,共勉!

学习框架

基础课程:

  1. python课程
  2. Linux(代码模型需要在服务器上跑,所以必须熟悉Linux的使用)
  3. 人工智能的相关知识(语音,NLP,图像在本质上需要学习的都是人工智能,其中语音>NLP>图像)
  4. 音频信号处理
  5. 高等数学->复变函数->信号与系统->数字信号处理

入门的话,就是能够自己理解FFT的原理,还有滤波器的原理(Z变换),就差不多了,至少分析频谱神马的没有问题了。

音频信号处理的话,编解码技术几乎就是集大成,
先从最简单的pcm->dpcm->adpcm->lpc的顺序学一下基本的编解码原理。

怎样学习语音信号处理

看到一篇知乎的回答:与我的共同点一样,本科都是CS背景:
我跟你背景是一样的,母背景是CS。现在基本都是做音频相关的研发。希望能从类似经历上帮你一些。EE(Electrical Engineering)的本科时候学的那些课,诗云已经完全罗列了。(高等数学->复变函数->信号与系统->数字信号处理)我知道你作为CS出身,后面三个可能都没上过。

总的来说,音频里面根据你要做哪类工作,要用的知识集不完全一样,比如我不做语音,平时做分析也少,那么我提取音频特征(比如MFCC等)那里就弄得少,各种模型(比如HMM)更用不到。但明显你看诗云他就是做这个相关技术的,那他就一定要知道和熟悉。我周围的朋友里做语音的和做音频信息检索的,当然就都要熟悉这方面的知识和前沿。从学习来讲,无论你的工作区域是在哪里,用哪个子集的知识,DSP(数字/离散信号处理)是永远要涉及的。所以在DSP上花费潜能和技能点绝不会有错。EE的这几个核心基础内容跟CS其实是挺平行的。

所以说会C/C++这一点,其实对学习EE基础知识帮助不大!!!

以上是概述而且我基本保证对任何人都是正确的,以下更多是结合我个人从CS出发学EE的经验,旨在给你借鉴。

建议直接上来就看DSP书籍,先不用管复变和SnS(信号与系统)。我认为这会是有效率的途径,也最不枯燥。DSP里涉及的基本上是你最需要和最想学的。这个话题你肯定是永恒要学习的东西,所以有的东西一次看不懂根本无所谓,以后慢慢会懂。经典教材肯定是奥本海姆和schafer的那个本离散时间信号处理大部头。这本书你CS出身直接读而且是自学的话,我能想象需要多大的毅力和精神力。所以建议最好能跟着EE本科的课程上个一学期,跟着做作业。另一种选择是找一些书的内容更简单和“通俗”一些的书籍,以前我翻到过一本 understanding digital signal processing。我没记错的话当时我的感觉就是讲述得很简单了。我的建议是读英文教材。我当时选择读英文教材的理由有两个,第一要出国,而且专业名词都是英文的看起来肯定有帮助;第二(这个更重要),中文教材我他妈就是看不懂。我当时跟你一样去问EE的朋友想寻找他们的上课路线,然后就去看郑君里的信号与系统甚至童诗白的模拟电路书,看的时候真的是各种看电视剧中间差了几集没看的感觉。中国字摆在那读完了就是跟没读似的。所以我当时就认为自己肯定是没从头跟着上课的原因了(尽管我知道肯定不是这个原因)。于是我就读老外的教材了,感觉他们的内容易懂很多。读DSP教材的时候,先只看基本的,进阶的以后再说。

根据你以后做的东西的不同,有些进阶知识可能就没有用,当然这是一种很势利的学习方法。SnS我觉得,如果你追求短期成长度和学习效率可以不用看了,在学DSP的很多时候可以做到不涉及SnS而只用DSP自己的知识进行理解。你做的工作以后可能只在离散域。以后掉过头来再学连续域是可以的。奥本海姆那本圣经教材,没学过SnS的话在个别地方会卡壳一些,但程度不大。那本understanding xxx,我印象中基本不懂SnS也能看下去。学另一门学科当然是很难的,更何况EE这么一个跟CS一样大的学科。所以有的放矢地学一定是最节能的选择。你不如先想好要做一个什么PROJECT,然后去采集相关知识然后自顶向下递归式地深挖学习吧,啃到下面的原理全搞通了以后,肯定有很多收获。然后一个Project学一点,一个Project学一点,过一阵子就能懂不少了。尽管没有本科式的系统学习,但还是有希望的。东拼西凑的学习以后还是得找个机会系统地学习一下。我是在研二的时候在Georgia Tech上了一学期本科的DSP课,老师是做语音的,上课举例子2π永远默认是8000赫兹。。当然用的奥本海姆的bible教材。之前当然已经有很多基础和经验了,但收获依然是很大,上课时能明显看出和那些本科学生在EE知识综合性和集成度的差别,但你只要着眼在你工作的领域的知识就行,就不用跟EE的人比谁的EE知识更全面了。当然上完那个课的感觉就是懂得多了,然后不懂得更多了。。对我来说DSP肯定是个永远要去温故知新的东西了。后来我又开始学模电,其实挺有意思。对理解一些信号也有些帮助。EE的学生肯定一开始要学模电。所以说我们作为CS背景EE门外汉从DSP开始学习信号,和他们从交流电路分析里开始学习信号,感觉肯定是不一样的,但希望能殊途同归。(另,你不感兴趣不用学模电。)所以你先给自己找project做吧,用matlab。比如1)做一个用到FFT提音高的算法,google一下应该能有很多辅导,这也算是个最最简单的提特征了 2)做一个数字低通滤波器算法(FIR和IIR)处理一下音频文件,对于CS出身,理解一下滤波器对培养EE和信号的感觉有帮助。

对于本科学习CS基础的我而言,觉得语音处理如鸿沟。就目前的想法而言是比较有挑战性的。

我认为现在的第一步就是先学好人工智能的基础课程,再深入学习语音信号处理。加油!共勉!

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值