1 相关系数法
先计算各个特征对目标值得相关系数,选择更加相关的特征
2 代码案例
import pandas
data = pandas.read_csv('D:\\database\\pystudy\\6.2\\data2.csv')
# 导热油特征选择的方法和相关系数的方法
from sklearn.feature_selection import f_regression
from sklearn.feature_selection import SelectKBest
# 代表选择特征值的数量
selectkBest=SelectKBest(
f_regression,
k=2
)
# 选择自变量
feature=data[['月份','季度','广告费用','客流量']]
# 调用fit方法进行最好特征的选择
bestFeature=selectkBest.fit_transform(
feature,
data['销售额']
)
# 查看关键因子
feature.columns[selectkBest.get_support()]