学习模式识别已经快一个月了,从开始的混沌迷茫到现在的小有感觉,不能说自己进步了很多,只能说自己没有虚度这一个月的时光。下面相对自己这一个月的学习做一个总结,希望各位老师同学能多提宝贵意见,毕竟学术要在交流中才能发展。
考研的生活结束后,顺利进入了理想的大学。然学习的紧张度却有增无减。刚拿到导师给的tutorials,感觉就像是天书一般,没有任何过渡就直接让我们接触算法和编程,诸如PCA,LDA,贝叶斯估计,MRF,Graphical Cut,Adaboost,SVM......这些东西以前根本没听,更别说让编程实现了。虽然自己是4月份拿到的tutorials,但真正开始看到现在只有一个月时间,因为刚开始是自己回家学习,没留校,所以有问题也没法解决。现在至少有同学们一块讨论(虽然都不太懂),多少能有所进步。自己每天都从早学到晚(虽然这是暑假),可能是自己智商有限,问题总是很多。学习模式识别,我感觉不应该只是学习算法,会编程就行了,因为如果你对理论不是特别清楚,怎么能写出高质量的论文?但也许是我太急功近利了,我看每一讲,不只看算法和编程,我还会上网查资料并且找一些详细的有数学推导过程的书籍,比如模式分类(这可谓经典之作),但学习过程中我发现,往往单纯学某一节会涉及到很多其他章节的内容,比如学到学贝叶斯理论,会有贝叶斯决策,贝叶斯估计,贝叶斯网络......学习MRF,会有马尔科夫网络,HMM,以及一系列满足马尔科夫性的过程(空间和时间两方面),而这每一方面的内容都是一个系统的理论,不是一朝一夕就能掌握,所以刚开始自己收获并不多,但经过看了这么多内容后我多少也有了一些自己的感悟。
一、首先我接触到的是最小二乘,这个还好理解,因为毕竟初中就有所耳闻,我记得最早接触的最小二乘的应用是在线性规划中,要求根据观测的数据拟合出最优直线,这方面的东西因为有理论基础了,所以学起来也较为顺手。但需要注意的一点是最小二乘对于那些outliers不鲁棒,所以这也算是它的缺点,另外针对这一问题有一些鲁棒的误差函数可以应用,还有一个重要的算法也可以解决,就是Ransac(Random sample consensus,随机采样一致性&#