机械学习:保险反欺诈预测

机械学习:保险反欺诈预测
摘要由CSDN通过智能技术生成

目录

前言:

这是阿里云天池大赛里面的项目,相关数据集可在阿里云学习赛【教学赛】金融数据分析赛题2:保险反欺诈预测中下载

一,赛题背景

二,导入库 加载数据

三,合并

3.1 合并train, test

3.2 处理

四, 数据处理

4.1  对包含?符号的进行处理

4.2  对日期特征进行处理

4.3 标签

5,数据建模

5.1 数据集切分

5.2 模型

 6,数据导入

前言:

这是阿里云天池大赛里面的项目,相关数据集可在阿里云学习赛【教学赛】金融数据分析赛题2:保险反欺诈预测中下载

一,赛题背景

以保险风控为背景,保险是重要的金融体系,对社会发展,民生保障起到重要作用。保险欺诈近些年层出不穷,在某些险种上保险欺诈的金额已经占到了理赔金额的20%甚至更多。对保险欺诈的识别成为保险行业中的关键应用场景。

二,导入库 加载数据

库只用到pandas 数据根据自己的路径修改

import pandas as pd

# 数据加载
train = pd.read_csv('./wen/train.csv')
test = pd.read_csv('./wen/test.csv')

三,合并

3.1 合并train, test

data = pd.concat([train, test], axis=0)
data.index = range(len(data))
## 数据探索
data.isnull().sum()
# 唯一值个数
for col in data.columns:
    print(col, data[col].nunique())
#标题
cat_columns = data.select_dtypes(include='O').columns

3.2 处理

column_name = []
unique_value = []
for col in cat_columns:
    #print(col, data[col].nunique())
    column_name.append(col)
    unique_value.append(data[col].nunique())

df = pd.D
  • 0
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值