1. Deep learning (深度学习), 这是近年来最火的研究方向,其实就是基于神经网络, 但需要deep structure. 以前因为种种的限制(hardware, lack of fast algorithm), deep learning没有太多得被关注,但近年来随着硬件和算法上的突破, 迅速成了业界最热的研究方向。目前已经应用到了语音识别,图像识别,NLP等等领域。尤其是在语音识别的图像识别上取得了很大的突破,做得非常出色的学者有Hilton(多伦多大学,现在搬到了GOOGLE), 斯坦福的andrew和他的学生,还有google,microsoft也都在投入很多钱在这个方向上。百度也在硅谷建立了深度学习的实验室。
2. Distributed/Parallel Computing. 训练机器学习算法是非常expensive的,而且随着大数据的到来,怎么把机器学习算法并行化或者用分布式的方式来解决是一个非常重要的问题。像hadoop也是迎合了这种需求。 但是这些平台目前还是只适合做数据处理(data precessing), 并不能完全并行化机器学习的核心算法,怎么去并行化而且快速的优化是一个值得研究的问题。 除了map-reduce,还有像GraphLab也是在做这个事情, 而且非常出色的框架,由CMU的Carlos (现在在UW)的团队做的,它可以做相对比较复杂的算法(像collaborative filtering, k-means, belief propagation..) 我觉得这个方向很有前途
3. Bayesian/Nonparametric。 这个领域也是随着硬件的发展而迅速崛起的领域。 像Bayesian mixture model, Dirichlet Mixture model, LDA, HDP, DP Process, Gaussian process,etc. 很多很多算法都可以设计成bayesian, 蛮有意思的。 除了具体的算法,这个领域还有一个重要的分支就是optimization, 像gibbs sampling, variational inference,而且怎么把它parallel也是很有趣的问题。 这个领域有几个大牛 (Michael Jordan (UC Berkeley), David Blei(Princeton), Tech(英国的学校),还有一个剑桥的教授,Emily Fox(UW), Taskar(UW), 还有一个BROWN大学的Erik Sudderth。
4. 如果喜欢应用的领域,可以去考虑推荐系统(collaborative filtering, content-based filtering, cold start problem.etc), 文本挖掘(opinion mining, search, text summarization. etc), 社交网数据分析(spam detection, geo-location analysis, keyword extraction.. 很多很多。。). 如果做文本挖掘, 我觉得用深度学习很有前途(虽然还没有完整的系统说深度学习很出色,但很多人正在尝试)。
2. Distributed/Parallel Computing. 训练机器学习算法是非常expensive的,而且随着大数据的到来,怎么把机器学习算法并行化或者用分布式的方式来解决是一个非常重要的问题。像hadoop也是迎合了这种需求。 但是这些平台目前还是只适合做数据处理(data precessing), 并不能完全并行化机器学习的核心算法,怎么去并行化而且快速的优化是一个值得研究的问题。 除了map-reduce,还有像GraphLab也是在做这个事情, 而且非常出色的框架,由CMU的Carlos (现在在UW)的团队做的,它可以做相对比较复杂的算法(像collaborative filtering, k-means, belief propagation..) 我觉得这个方向很有前途
3. Bayesian/Nonparametric。 这个领域也是随着硬件的发展而迅速崛起的领域。 像Bayesian mixture model, Dirichlet Mixture model, LDA, HDP, DP Process, Gaussian process,etc. 很多很多算法都可以设计成bayesian, 蛮有意思的。 除了具体的算法,这个领域还有一个重要的分支就是optimization, 像gibbs sampling, variational inference,而且怎么把它parallel也是很有趣的问题。 这个领域有几个大牛 (Michael Jordan (UC Berkeley), David Blei(Princeton), Tech(英国的学校),还有一个剑桥的教授,Emily Fox(UW), Taskar(UW), 还有一个BROWN大学的Erik Sudderth。
4. 如果喜欢应用的领域,可以去考虑推荐系统(collaborative filtering, content-based filtering, cold start problem.etc), 文本挖掘(opinion mining, search, text summarization. etc), 社交网数据分析(spam detection, geo-location analysis, keyword extraction.. 很多很多。。). 如果做文本挖掘, 我觉得用深度学习很有前途(虽然还没有完整的系统说深度学习很出色,但很多人正在尝试)。
学好机器学习最重要的还是先选好一个问题(根据自己的爱好,不要太在乎以后的就业), 然后把这个问题一直做下去,等你能在你的领域上发出高质量的论文的时候,你已经差不多成为机器学习的专家了。
FROM:http://www.douban.com/note/347941130/