scikit-learn线性判别实践 - 随机生成数的降维
任务描述
利用 sklearn 构建 LDA 对数据进行降维。
相关知识
LinearDiscriminantAnalysis
在降维时,LinearDiscriminantAnalysis 的构造函数中有一个常用的参数可以设置:
-
n_components:即我们进行 LDA 降维时降到的维数。在降维时需要输入这个参数。需要注意的是,n_components 值的范围是 1 到 类别数-1 之间的值。
LinearDiscriminantAnalysis 类中的 fit 函数用于训练模型,fit 函数有两个向量输入: -
X :大小为**[样本数量,特征数量]**的 ndarray,存放训练样本;
-
Y :值为整型,大小为**[样本数量]**的 ndarray,存放训练样本的标签值。
LinearDiscriminantAnalysis 类中的 transform 函数用于降维,返回降维后的数据,transform 函数有一个向量输入:
-
X :大小为**[样本数量,特征数量]**的 ndarray,存放需降维的样本。
LinearDiscriminantAnalysis 的使用代码如下:
from sklearn.discriminant_analysis import LinearDiscriminantAnalysis
def lda(x,y):
'''
input:x(ndarray):待处理数据
y(ndarray):待处理数据标签
output:x_new(ndarray):降维后数据
'''
#********* Begin *********#
lda = LinearDiscriminantAnalysis(n_components=2)
lda.fit(x,y)
x_new = lda.transform(x)
#********* End *********#
return x_new