科技金融新篇章:揭秘欺诈风险识别的革命之路!

       赛题名称:
  科技金融应用:欺诈风险识别(通过资金交易流水识别涉诈涉赌账户)

  出题单位:
  兴业银行股份有限公司

  赛题背景:
  近年来,跨境赌博、电信网络诈骗、黑产等外部欺诈违法犯罪形势日益严峻,呈现线上化、产业化、团伙化等特征,国家层面高度重视反欺诈治理工作,执法和监管机构对反欺诈管理要求日趋严格。党的二十大的报告中发布了“以人民为中心”“统筹发展与安全”的重要指示。银行业金融机构需筑牢反欺诈“防火墙”,为业务的健康发展保驾护航;践行金融为民,坚决守护人民群众的财产安全,提高人民群众的幸福感、安全感和获得感;牢牢把握金融工作的政治性、人民性,提升专业性。同时,监管机构要求各家银行开发和运用有效的金融科技和大数据系统,分析涉赌涉诈资金交易新方式,总结资金风险新特征,持续优化风险监测模型,全面排查存量风险。于2022年12月正式施行的《中华人民共和国反电信网络诈骗法》把反欺诈工作上升到了法律层面。该法案亦指出,银行业金融机构应当建立完善符合电信网络诈骗活动特征的异常账户和可疑交易的监测机制。

  赛题任务:
  本赛题旨在运用有效的金融科技和大数据系统,分析涉赌涉诈资金交易新方式,持续优化风险监测模型,通过赛题提供的涉赌涉诈黑名单、白名单及用于训练的相关交易流水数据集,构建涉赌涉诈账户算法识别模型,全面排查存量风险。

图片

具体模块如下:

步骤1 数据及变量展示

步骤2 基于资金流向进行关联网络图构建

步骤3 基于社区划分算法划分风险团伙

步骤4 总结

欺诈风险识别-数据及变量展示

训练数据构成:

1、训练集:300户涉诈涉赌账户(标志为1)+900户低风险账户(标志为0);

2、数据简介:账户交易流水、账户静态信息(均为仿真数据)

图片

图片

注:交易信息表里的“账户代号”,均为本行卡。与账户静态信息表里的“账户代号”关联。

交易信息表里的“对方账号”可能为行外账号,“对方账号+对方行号”与账户静态信息表里的“账户代号+开户行代号”关联。

账户静态信息

图片

账户交易信息

图片

欺诈风险识别-基于资金流向的关联网络构建

通过资金交易流水识别涉诈涉赌账户,基于“借贷标志”来判断客户是出账还是入账,确认客户与客户之间的关联资金流向关系,来构建关联网络图。

图片

根据流水序号和流水金额,按照账户代号、对方账号,来统计双方之间存在的资金流水交易次数、总金额大小,来检测交易关系的密切关系和频繁性

图片

筛选留下交易金额较大的客户交易节点,一般设置金额大于1万元以上,筛选后有42793个流水交易关系。

欺诈风险识别-基于社区划分算法划分风险团伙

基于networkx包对获取到的数据构建全局网络,通过Louvain算法对全局网络进行社区划分,计算得到模块度为

modularity: 0.8125,表示社区划分的效果还不错。

再对每一个团内的节点进行匹配欺诈标签,统计每一个团的欺诈率数据,再根据团内的节点的数量进行初步筛选,一般出现团伙欺诈和资金风险都是集中性、聚集性的行为。初步设定团内的节点个数大于10个。

图片

#团488共有14个节点,13条边,其中2个节点为欺诈节点
nou_tuan=dfs[dfs['tag']==488]['node'].tolist()
nou_tuan_G=data_jyszonses[(data_jyszonses['账户代号'].isin(nou_tuan))|(data_jyszonses['对方账号'].isin(nou_tuan))]

# 基于networkx包对获取到的数据构建全局网络
'''
在构建全局网络时,可为节点设置权重,格式如下:
G = nx.from_pandas_edgelist(mydata, source='source',target='target',edge_attr=['weight'])
'''
G_mou = nx.from_pandas_edgelist(nou_tuan_G, source='账户代号',target='对方账号',edge_attr='交易次数',create_using=nx.DiGraph())

print('全局网络中节点的数量为:', G_mou.number_of_nodes())
print('全局网络中边的数量为:', G_mou.number_of_edges())

图片

图片

▍总结

综上所述,基于资金交易流水识别涉诈涉赌账户,构建关联网络图、划分社区,优化风险模型。筛选大额交易节点,设置团内节点数大于10个。应用金融科技和大数据,分析新交易方式,构建识别模型,全面排查风险。根据涉赌涉诈黑名单、白名单及用于训练的相关交易流水数据集,构建涉赌涉诈账户算法识别模型,全面排查存量风险。

  • 23
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
1.项目代码功能经验证ok,确保稳定可靠运行。欢迎下载使用!在使用过程中,如有问题或建议,请及时私信沟通。 2.主要针对各个计算机相关专业,包括计科、信息安全、数据科学与大数据技术、人工智能、通信、物联网等领域的在校学生、专业教师或企业员工使用。 3.项目具有丰富的拓展空间,不仅可作为入门进阶,也可直接作为毕设、课程设计、大作业、初期项目立项演示等用途。 4.当然也鼓励大家基于此进行二次开发。 5.期待你能在项目中找到乐趣和灵感,也欢迎你的分享和反馈! 【资源说明】 基于python实现的金融欺诈风险识别项目源码(含数据集+说明+详细注释).zip 科技金融应用:欺诈风险识别 # 基本思路 特征其实都是一些聚合统计,思路主要是3 4 5按照月份分别建立三个子模型(原因:发现如果3月有流水信息、4月突然间没有流水信息的样本,很容易判定为欺诈样本,因此做了三个子模型学习一下当月的情况)将预测值作为特征;模型2中把绝对时间全部修改为相对时间+三个子模型的预测值作为模型;测试过程发现不同随机种子影响很大,因此做了多种子融合。提交1200样本,大约881线上成绩;提交1100样本,大约885-886线上成绩 基于python实现的金融欺诈风险识别项目源码(含数据集+说明+详细注释).zip 基于python实现的金融欺诈风险识别项目源码(含数据集+说明+详细注释).zip 基于python实现的金融欺诈风险识别项目源码(含数据集+说明+详细注释).zip 基于python实现的金融欺诈风险识别项目源码(含数据集+说明+详细注释).zip
### 回答1: 保险反欺诈预测是金融数据分析的重要应用之一。该赛题是基于保险数据集,旨在通过分析和挖掘数据特征,建立一个反欺诈预测模型的基准线。 首先,我们需要对保险数据集进行预处理和清洗,包括处理缺失值、异常值和重复值等。然后,我们可以进行特征工程,提取出与反欺诈相关的特征。常见的特征可以包括被保险人的年龄、职业、保险金额、历史理赔记录等信息。 接下来,我们可以选择合适的机器学习算法来构建预测模型。常用的算法包括逻辑回归、决策树、随机森林等。在构建模型之前,我们需要将数据集划分为训练集和测试集,用训练集进行模型训练,然后用测试集评估模型的性能。 评估模型的性能可以使用常见的指标,如准确率、精确率、召回率和F1值等。这些指标可以帮助我们评估模型的预测能力和误判率。 最后,我们需要对模型进行优化和改进。可以通过调整模型的参数、增加更多的特征或者尝试其他的机器学习算法来提高模型的预测性能。同时,对于不平衡样本问题,可以采用欠采样、过采样或者集成学习等方法来解决。 总结起来,保险反欺诈预测的baseline建立包括数据预处理、特征工程、模型构建和优化等步骤。通过不断地优化和改进,我们可以建立一个有效的反欺诈预测模型,提高保险公司的风险控制能力。 ### 回答2: 金融数据分析赛题2: 保险反欺诈预测baseline是指在保险领域中,利用金融数据分析的方法来预测保险反欺诈的基础模型。 保险反欺诈预测是指利用大数据和机器学习算法等技术手段,对保险投保人的风险进行分析和预测,从而提高保险公司的风险管理能力,减少保险欺诈行为。 基于金融数据分析的保险反欺诈预测baseline主要包括以下几个步骤: 1. 数据收集:收集与保险欺诈相关的数据,包括投保人的基本信息、历史保险记录、理赔记录等,以及其他与保险欺诈相关的非保险数据。 2. 数据清洗和预处理:对收集到的数据进行清洗和预处理,包括去除异常值、缺失值处理、数据标准化等。确保数据的质量和可用性。 3. 特征工程:根据业务需求和领域知识,对数据进行特征提取和构建。包括基本特征、组合特征和衍生特征等。 4. 模型选择和训练:选择适用于保险反欺诈预测的机器学习模型,例如逻辑回归、决策树、支持向量机等。通过训练数据拟合模型,并进行调参和验证,得到最佳模型。 5. 模型评估和优化:利用评价指标如准确率、召回率、F1值等对模型进行评估,并进行模型优化和调整,提高模型的预测性能。 6. 模型应用和部署:将优化后的模型应用于实际场景,进行实时预测和反欺诈行为识别。并对模型进行监测和更新,保持模型的准确性和稳定性。 基于以上步骤,金融数据分析赛题2的保险反欺诈预测baseline可以建立一个初步的保险反欺诈预测模型,并得到一组基本的预测结果。然后可以根据比赛的具体要求和模型效果进行进一步的改进和优化,提高保险反欺诈预测的准确性和稳定性。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值