python|特征选择

import pandas as pd
import numpy as np
from sklearn.feature_selection import SelectKBest
from sklearn.feature_selection import f_regression

df = pd.read_csv('C:/Users/.......csv')
x = df.drop('Accident_Level', axis=1)  # df中删掉某一列,扔掉列axis=1
y = df['Accident_Level']

# select feature by person coefficient
X = np.array(x)
Y = np.array(y)
skb = SelectKBest(score_func=f_regression, k=5)
skb.fit(X, Y.ravel())
print('选择的特征有:', [x.columns[i] for i in skb.get_support(indices=True)])
X_selected = skb.transform(X)
print('X_selected.shape:', X_selected.shape)

输出

选择的特征有: ['WorkingDay', 'Weather', 'Slope', 'Traffic_Volume', 'Truck_Ratio']
X_selected.shape: (968, 5)
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值