XGBOOST模型对于一些场景有着不错的表现,切提供了一个很多的特征重要性的计算:
准备:
把一些用到的包安装一下,如xgboost,sklearn等
建议使用国内的镜像源,否则106M会让你等很久,
具体可以参考:
pip安装包较慢的解决办法_这孩子谁懂哈的博客-CSDN博客
1.使用的 Pima印第安人糖尿病的测试数据集;
下载地址:皮马印第安人糖尿病数据集免费下载分享-机器学习文档类资源-CSDN下载
2.计算特征重要性:
# plot feature importance manually
from numpy import loadtxt
from xgboost import XGBClassifier
from xgboost import plot_importance
from matplotlib import pyplot
import sklearn
# load data FE_pima-indians-diabetes.csv
dataset = loadtxt(r'C:\Users\Administrator\Desktop\pima-indians-diabetes.csv', delimiter=",",skipro