语音识别中,为了增强音频特征的鲁棒性,需要提取区分能力较强的特征向量,常用的方法是PCA和LDA算法。
PCA算法寻找,保留数据中最有效的,最重要的成分,舍去一些冗余的,包含信息量减少的成分。
LDA算法是通过一个变化矩阵来达到降维的目的,LDA与PCA不同之处在于,LDA使得样本内的分布凝聚,使得样本间的分布疏远,这样的特征更加有代表性,在分类里面LDA算法更优。
如下图所示:
LDA有如下假设:
1)特征向量投影后不是所有的维都包含具有区分力的信息,他们都被包含在前P维子空间,而后(n-p)维子空间不包含有用的信息而被忽略;
2)每个样本内都是高斯分布。
公式定义如下: