建筑能源得分预测报告解释模型部分 GBDT

最新推荐文章于 2024-05-11 09:01:59 发布

每天都要被自己菜醒

最新推荐文章于 2024-05-11 09:01:59 发布

阅读量289

点赞数 1

分类专栏：大数据文章标签： python 机器学习

本文链接：https://blog.csdn.net/qq_45531594/article/details/108526204

版权

本文介绍了如何使用GBDT模型并解释其特征重要性。通过LIME方法进行局部解释，并探讨了基于特征重要性进行特征选择的效果。实验表明，仅依赖重要性选择特征可能不会改善模型性能，同时展示了LIME在解释预测结果上的应用。

摘要由CSDN通过智能技术生成

工具包导入：

# Pandas and numpy for data manipulation
import pandas as pd
import numpy as np

# No warnings about setting value on copy of slice
pd.options.mode.chained_assignment = None
pd.set_option('display.max_columns', 60)

# Matplotlib for visualization
import matplotlib.pyplot as plt
%matplotlib inline

# Set default font size
plt.rcParams['font.size'] = 24

from IPython.core.pylabtools import figsize

# Seaborn for visualization
import seaborn as sns

sns.set(font_scale = 2)

# Imputing missing values
from sklearn.preprocessing import Imputer, MinMaxScaler

# Machine Learning Models
from sklearn.linear_model import LinearRegression
from sklearn.ensemble import GradientBoostingRegressor

from sklearn import tree

# LIME只会对每一个样本进行解释
import lime #需要安装 pip install -i https://pypi.tuna.tsinghua.edu.cn/simple lime
import lime.lime_tabular


import warnings
warnings.filterwarnings("ignore")

读取数据：

先拿到我们上个模型的结果

#上次保存好的数据加载进来
#这些数据集经过test_train_test 
# Read in data into dataframes 
train_features = pd.read_csv('C:/Users/lb/Desktop/data/training_features.csv')
test_features = pd.read_csv('C:/Users/lb/Desktop/data/testing_features.csv')
train_labels = pd.read_csv('C:/Users/lb/Desktop/data/training_labels.csv')
test_labels = pd.read_csv('C:/Users/lb/Desktop/data/testing_labels.csv')

缺失值处理：

# 用中值代替缺失值
imputer = Imputer(strategy='medi

最低0.47元/天解锁文章

每天都要被自己菜醒

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
建筑能源得分预测报告解释模型部分 GBDT

工具包导入：# Pandas and numpy for data manipulationimport pandas as pdimport numpy as np# No warnings about setting value on copy of slicepd.options.mode.chained_assignment = Nonepd.set_option('display.max_columns', 60)# Matplotlib for visualizationim
复制链接

扫一扫