基于XGBoost保险赔偿预测

最新推荐文章于 2023-06-10 22:58:22 发布

好瘦的小胖子

最新推荐文章于 2023-06-10 22:58:22 发布

阅读量1.7k

点赞数 2

分类专栏：机器学习文章标签： Kaggle XGboost

本文链接：https://blog.csdn.net/qq_29547673/article/details/89319061

版权

本文探讨了使用XGBoost模型预测保险赔偿的案例，源自Kaggle竞赛。数据预处理包括对类别属性编码和对目标值进行对数变换。建模时，采用GBTree作为booster，设定多分类问题并调整多项参数以优化模型，如gamma、max_depth和subsample等。通过参数调节，降低了过拟合风险并改进了数据采样策略。

摘要由CSDN通过智能技术生成

数据介绍

https://www.kaggle.com/c/allstate-claims-severity

keggle比赛保险赔偿预测

观察数据

导入库

#导入库
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
from sklearn.linear_model import LogisticRegression#逻辑回归模型
from sklearn.ensemble import RandomForestClassifier#随机森林模型
from sklearn.metrics import roc_auc_score as AUC#AUC统计
from sklearn.metrics import mean_absolute_error
from sklearn.decomposition import PCA#主成分分析
from sklearn.preprocessing import LabelEncoder,LabelBinarizer
from sklearn.model_selection import cross_val_score
import xgboost as xgb

from scipy import stats
import seaborn as sns
from copy import deepcopy

%matplotlib inline

读取数据

train = pd.read_csv("E:Data\\kaggle_Allstate_Claims_Severity\\train.csv")
test = pd.read_csv("E:Data\\kaggle_Allstate_Claims_Severity\\test.csv")

训练集 188318*132

132个属性，1个id，116个类别属性，14个数值属性，最后的目标为loss属性对应的值

最低0.47元/天解锁文章

好瘦的小胖子

关注

2
点赞
踩
14

收藏

觉得还不错? 一键收藏
2
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录