以前看机器学习的书本,好像会直接跳过这一节,对于LDA直接无视,估计是在实际应用中用得很少。可是百度查了一下,它的使用场景还比较广泛,包含人脸识别、目标检测、语音识别、信用卡欺诈检测等。并且它的优势多多:
- 可以直接求解析解,对不平衡数据有优势。
- 与神经网络相比,不需要调参。(后面查了一下,这里可能是有学者改进了LDA方法,然后论证了它不需调参的优势,至于实际应用,好像没有)
- 与支持向量机相比,计算效率更高。
好吧,搜索了一圈,也只能搜到讲解其理论基础的文章,鲜少有介绍其应用前景的(侧面说明其暂时没有前景)。回到百度百科维基词条:
于是我发现,LDA与模式识别存在关联,于是又搜了一下模式识别,发现它的概念和分类预测也有点混淆。这个直接加入后续学习清单。
再来看LDA的应用领域,应该说比较小众,包括破产预测、人脸识别、市场营销、生物医学研究、地球科学等领域(维基百科)。LDA有被LR取代的趋势,除非它用于降维(类似PCA,而PCA是无监督降维)。
所以它可能是先进的统计学方法、普通的模式识别方法和落后的机器学习方法。不过像这样去追溯机器学习(或者说统计学习)的发展历程,查到很多古老文献,和非主流论文,也很有意义。