近期使用sklearn框架中的LDA模块进行二分类预测时,出现以下警告:
UserWarning: Variables are collinear. warnings.warn("Variables are collinear.")
由于我使用的数据集是一个非常稀疏的矩阵,而LDA在求解过程中需要求数据的逆矩阵,所以会出现以上警告。
详细的解释是:
LDA涉及计算矩阵求逆,如果行列式接近于0,则该矩阵求逆是不准确的。所以出现了警告。
该警告说明你的预测因子之间会是相关的,而不是独立的。这意味这X1和X2一起对y产生了影响,则X1的每个变化将通过X2的变化来补偿,这使得你无法估计系数Xi对结果y的影响。