带你上手 AI 大赛

原创:晏茜

资料来源:陈旸

本文的主要内容包括以下环节,首先既然文章内容是关于 AI 大赛的,我希望大家直接跟随作者上手去打一场比赛,在这篇文章中,会以保险反欺诈预测比赛为例,通过介绍整个比赛的过程,我们会了解到常用的机器学习神器,同时也会给大家介绍一个工具 —— AutoML。

那么,AutoML 代表什么含义呢?AutoML 在工作中会有所使用,在比赛中,有些选手也会使用。在去年的 CCF 个贷违约预测这场比赛中,广发银行的选手就使用了 AutoGluon。AutoGluon 这个软件是亚马逊开源的一个自动机器学习的工具,自动机器学习的价值就是帮你做一些自动特征工程。我们知道在打比赛的过程中,特征工程是一个非常消耗时间,并且需要不断试错的一个过程,AutoML 就是把它包装好的一种工具,可以让它自己自动的去做一些特征组合,我们在下文会带大家了解这个工具的情况,未来大家可以尝试去使用。在 AutoML 这个细分领域里面,其实很多大厂都已经开源了一些工具。本文给大家介绍一种工具 AutoGluon,该工具的作者之前专门打过 kaggle 比赛( kaggle 社区是专门为数据科学准备的社区),所以对于 kaggle 比赛的规则,怎样去提分,怎样在项目中取得很好的名次都有所了解。他将所有的规则融合到了一个工具里面,这个工具就是 AutoGluon。所以相比于其他的 AutoML 来说,AutoGluon 的结构会更精准一些,它的提分效果也会比一般的 AutoML 好一些。

一、保险反欺诈

首先我们来了解一下保险反欺诈预测比赛。

说到这个场景,先给大家普及一下保险反欺诈的实际价值。在全球的保险中,用于理赔的金额,有将近 20 %,有的甚至高达 50 % 是欺诈行为,每年有将近 800 亿美元被保险欺诈,如果我们能够把这个行为识别出来,哪怕只识别 1 %,都具有非常大的价值。保险欺诈仅次于偷税,是第二大的犯罪行为。近年来,我国对税收的监管越来越严格,保险反欺诈也更成为一个重要的应用场景。在对于过去倒闭的保险公司的调查中,我们发现有将近 1 / 3 的保险公司倒闭的原因都直接与保险反欺诈相关。保险公司遭遇一些诈骗团伙的保险欺诈,会造成非常大的经济损失。那么,保险公司就束手无策了吗?有没有方法可以帮助保险公司去识别风险呢?

举个例子,南非最大的短期保险公司 —— Santam,通过调查发现,这家公司每年有将近 10 % 的保费是属于欺诈行为,既然他们已经发现了这种行为,那么我们就有了 label,有了这个标签,我们试想能否去做一个机器学习的预测,预测它可不可能是欺诈。如果这种行为的欺诈概率很低,保险公司就快速进行理赔,如果这种行为的欺诈概率很高,保险公司就需要人工的来进行进一步的勘察。这样做的好处是可以将理赔行为进行分类,在之前的行为过程中,保险公司都会花费将近三个工作日才能完成理赔,因为他们要将所有的行为都去做一个勘测,这样人工成本就会非常的高,人工成本很高的话,用户的保险理赔的速度就会很慢,那么所有的保险基本上都需要三个工作日才能完成理赔,对于我们正常的用户来说,就会耽误自己的赔保的效率,欺诈成本会以更高的保费形式转嫁到其他客户身上。因此我们有必要帮助保险公司去做第一关的把控,而这个把控可以通过数据建模的方式来实现。

第二个例子是关于支付宝安全险的案例。支付宝于 2015 年推出了账户安全险,它可以保障你的支付宝账户的安全性。假如你购买了一份支付宝安全险,如果你的账户被盗或被偷刷,它最高会赔付 100 万的金额。有一则新闻报

  • 3
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值