目录
一、赛题背景
赛题以保险风控为背景,保险是重要的金融体系,对社会发展,民生保障起到重要作用。保险欺诈近些年层出不穷,在某些险种上保险欺诈的金额已经占到了理赔金额的20%甚至更多。对保险欺诈的识别成为保险行业中的关键应用场景。
二、数据加载
1.导入相关库
2.导入训练集:
运行结果:
3.导入测试集:
运行结果:
三、合并数据集(对train和test进行合并)
合并数据集(对train和test进行合并)
运行结果:
四、数据清洗
统计数据为空的值
运行结果:无空值,无需对数据预处理