休学的后半段时间逐渐展开的学习历程:(以下标红的为在暑假期间,要整理写为博文的内容或者是链接。)
①edx上的:6.00x Intuoduction to Computer Science and programming
课程教学内容为python语言教学及编程思想培养,课程内容比较基础。但考虑到能独立完成一整套简单的自然语言处理的实验,python的学习的水平应该已经达到基础的标准,再接下来就是不断通过实践,逐步提升python的使用技巧和编程思想了。python课程本身也有实验,但是考虑每周的大实验总是会提供一部分框架,所以难度也就属2.5(满分5)。完成的有记录意义的实验如下:
②coursera上的: Natural Language Processing(NLP)
完成这门课程的学习应该算是这学期最有价值的事之一了。总的来说自然语言处理所涉及的方向是:机器翻译,任何两种语言之间的;对话系统,目的就是能够使人与机器用自然语言进行交流;信息提取,目的就是能够使一个结构化一个文本或语音,比如中文分词,句子结构的划分等。
这门课程学习了很多不同的自然语言处理的算法,并且每一个算法都会给予两周的时间来完成一个实验。之所以觉得有价值,就是因为这门课的实验是需要完全自己设计的,所以每次内容都需要花费大量的时间来编写与修改。同时还不能低于一定的处理正确率,每次完成之后,都感觉对算法、python的掌握有了很大的提高。由于我之后并没有再就任何一个算法深究下去,所以并不知道学习的各个算法在各个自然语言处理方向上处于什么地位。从我自身猜测来说,应该都是基础但必要的,并且还会有很多变体存在。不过值得一提的是,这个老师教的算法里,其中有一、两个是他自己有突出贡献的,所以学习的应该还是比较正宗前沿的,就是在课程要求的深度上应该还没有达到老师真正的水准。我给这门课的难度评分为3.5-4.0(满分为5)
学习中所涉及的算法(名字还有待调整)(之后对每个算法分别开单章进行总结,并附上相应的python程序。)
Ⅰ Hidden Markov Models
Ⅱ Probabilistic context-free grammars(Parsing)
Ⅲ Translation Alignment(IBM model1/2)
Ⅳ Log-linear models
Ⅴ Unsupervised and semi-supervised learning
这门课程的学习应该说仅仅是令我走进了机器学习这个方向的大门。倒不是在说这门课的水平深度不够,相反这门课老师是机器学习领域的大牛NG,属于现在最火的deep learning的领军人物,课程的教学设计中所传授的这些机器学习算法,会让你先有一个instinct的感觉,再告诉你这个算法是要干什么的,为什么要这么去干,实际干的时候还应该解决什么问题。NG同时也是coursera这个平台的创始人之一,可能是为了让更多的人能够接受这个平台,他自己在设计这门课程的时候,可能把门坎有所降低,课程算法更深层次的原理并不在网络课程范围内,程序的大体框架给的也比较全面,每次只需要完善几个function的内容就好了,难度属于2.5-3(满分为5)
课程中所学习的算法如下:(各个算法相应的内容暂时不会都开单章,有部分提供的链接是同时上这门课的同学写的博文。)
Ⅳ Support vector machine
Ⅴ K-means Clustering
Ⅵ PCA dimensionlity reduction
Ⅶ (Guassion method)Anomaly detection
Ⅷ Recommender system
④国创项目:语音音色的研究与应用
有关这个项目是什么,干什么,实在没啥兴趣给自己再摆一遍,直接写写学习了什么,干了什么:
语音理论背景: 有关语音的发生,传递,接收的物理生物流程 |
语音信号处理: 语音时域、频域的基本分析操作(频域图,频谱图) |
实验: Praat语音学软件操作 |
语音理论背景: 一阶隐马尔科夫及其三个问题的理论 |
语音理论背景: 高斯混合模型(皮毛) |
语音理论背景: 语音波形拼接理论(皮毛) |
实验: 基于隐马尔科夫的语音识别工具箱HTK:简单yes、no识别 |
实验: 基于隐马尔科夫的语音识别工具箱HTK:电话拨号系统(未完成) |
实验: 基于隐马尔科夫的语音合成工具箱HTS(未完成) |
语音信号处理: MFCC梅尔倒谱系数的理解 (一) |
就这么简单一看啊,一学期好像还是什么也没干,学了一大堆的理论背景啊、理论知识啊,实践实验实在太少。学习的理论层次也不足够深入,学过的也掌握的不够扎实,这么一说一学期相当于白干了。(应该没惨到白干的地步。)下一步的计划思路,放慢学习理论的速度,以巩固以前,多设计实践实验或项目为主,学习新算法为辅提高一下自信心。
暑期计划大目标:
1 GRE
2 整理以上红字内容章节
3 机器学习:deep learning UFLDL教程
4 书单
4 密码学
5 信号分析