函数:pearsonr(x,y)
功能:
计算特征与目标变量之间的相关度
参数说明:
1)输入:x为特征,y为目标变量.
2)输出:r: 相关系数 [-1,1]之间,p-value: p值。
注: p值越小,表示相关系数越显著,一般p值在500个样本以上时有较高的可靠性。
示例:
数据
- 样本数:1000
- 特征数:3(3维数据)
- 重要特征:1
from sklearn.datasets import make_regression
X,y = make_regression(n_samples=1000, n_featur