2021年中国大学生保险数字挑战赛参赛总结
比赛成绩
A榜排名第8,分数 0.90578985 ;B榜排名第11,分数0.90607387 。
赛题理解
本次比赛赛题是预测车险续保客户随车非车购买结果,本质上是一个二分类问题。其中训练集中的数据量为 684283, 测试集为80110,数据量不是很大。数据包含以下65个字段:
字段名 | 说明 |
---|---|
client_no | 客户号 |
dpt | 机构:共有 11 个机构,以三位数为代码,如 210 |
xz | 险种:“商交”,“单交” |
xb | 险别:“交三”,“主全”,“单交” |
carid | 标的号(主键) |
nprem_ly | 上年车险保费 |
ncd_ly | 上年 NCD |
newvalue | 新车购置价 |
bi_renewal_year | 车险续保年限 |
clmnum | 车险出险次数 |
regdate | 初登日期 |
trademark_cn | 品牌 |
brand_cn | 厂牌中文名称 |
make_cn | 车型中文名称 |
series | 车系 |
capab | 排汽量 |