前言
很早就听说过人工智能,模式识别这些概念,但是一直觉得深不可测,读研后,最开始导师只交代了下课题方向做树叶的识别。
当时觉得自己有android的功底,编程上应该没有什么问题。开始也不是很清楚工程和研究的区别。工程上用好SSH,再了解点原理,可能就不错了。可是随着慢慢了解图像识别才发现和之前做的事情有一些不同。
之前做android时,发现不同语言之间(这样形容不是太合适)很多模块功能都一样。比如anroid里的fragment和html里的iframe,换汤不换药。
过程
但是做课题方向时不一样了。开始真的一点都不懂,准备着手看时,了解了一些概念。第一个概念是特征提取。。
后来知道了什么颜色特征,纹理特征,SIFT特征,不动点特征,知道了什么是鲁棒性,旋转不变性,位移不变,什么是高斯模糊,卷积。。
那会想,不就是提取很多特征,然后算欧氏距离判断分类...直到后来接触传说中机器学习十大算法。才知道分类也不是这么easy的想法。
后来又接触了一个概念PCA(主成份分析),决定补一下矩阵课本...
浏览了五六本数字图像处理的书,发现内容也都差不多,学了个新的概念叫小波变换...LZ就是走到哪学到哪,感觉哪都不懂啊。
还看了一阵OpenCV来进行特征提取。
看了八集积极斯坦福大学安德鲁.NG的公开课就看不太懂,发现自己是个数学渣(其实也不能全怪我=。=,上大学老师也从没讲过数学这东西能干啥。老师:“怪我咯?”)
到这又有新概念了——机器学习,深度学习,卷积神经网络,深度信念网络...开始还是很搞不清是什么意思,后来缕清了,深度信念网络和卷积神经网络是深度学习的算法,深度学习是机器学习的一种。好像画张图比较能说明。。
然后最近一直在看卷积神经网络的论文,这东西搞图像识别可以。好多概念还是不懂,边做变学吧。
现状
使用卷积神经网络框架Caffe做实验。又开始倒腾这个东西,笔记本显卡是GT540(2010年买的老古董了,只不过换了一块SSD重获新生),现在的CUDA都不支持了,熬到大年初六就赶紧回学校实验室配置Caffe,在windows上弄的,今天跑了跑能跑起来。又买了块SSD装一个linux,将来就在这上面做实验了。。
接下来先要弄明白Caffe的目录结构,工作原理。把example里的mnist搞明白。
愿景
已经走了很多弯路了,如果您有好的指导,教我教我教我……