研究生创新基金项目申报书范本 | 欺诈鼠VS机器猫:商业银行能否巧妙“以猫辨鼠”?

摘要:随着银行业的迅猛发展,银行信贷欺诈风险也日趋严重。白桦林金属公司与银行人员及评级机构勾结骗取内蒙古银行贷款1.3亿元,致使银行损失本金及利息合计1.54亿元。“欺诈鼠”肆意猖獗,商业银行该何去何从?能否使用“机器猫”巧妙辨识施诈者?因此本项目运用商业银行企业客户真实数据为样本,运用两种机器学习技术(“机器猫”)探讨能供商业银行识别企业信贷欺诈的方法。首先对商业银行的企业客户进行信用特征分析,其次采用特征工程技术提取关键特征,再利用GBoost机器学习方法以关键特征数据进行建模,从而达到从信用特征判别企业客户发生信贷欺诈概率的目的。以期彻底杜绝信贷欺诈行为、充分发挥信贷反欺诈前瞻性和有效性的作用,为商业银行信贷反欺诈提供科学的参考。

目录

(一)立项依据

1、研究背景

2、研究目的及意义

(1)理论意义

(2)现实意义

3、国内外研究现状和趋势分析

(1)国外研究现状

(2)国内研究现状

4、参考文献

(二)研究内容及研究目标

1、研究内容、研究目标,拟解决的关键科学技术问题

(1)研究内容

(2)研究目标

(3)拟解决的关键科学技术问题

 2. 项目的特色与创新之处,请比较分析

3.拟采取的研究方案及可行性分析

(1)研究方法

(2)技术路线

(3)关键技术

(4)可行性分析

4.项目进度安排

(三)研究基础和条件

1、与本项目有关的研究工作积累和已取得的研究工作成绩

2、已具备的实验条件,尚缺少的实验条件和拟解决的途径

3、申请人和项目组主要成员的研究工作简历

(四)研究预期成果、提交成果形式及今后拟实现预期目标计划安排准备情况。


(一)立项依据

1、研究背景

伴随着信息技术的兴起,信贷欺诈的技术和手段不断升级且欺诈形式日趋隐蔽、复杂和智能化,商业银行面临信贷欺诈的风险与压力更加剧烈。据统计,作为中国“五大银行”之一的中国建设银行,贷欺诈风险在建设银行操作风险占比高达20%,给其带来严重的经济损失和声誉伤害。目前,多数国外大银行早已将欺诈风险管理作与日俱增、防不胜防为企业核心竞争力的重要考核,基本构建了以相对独立的欺诈风险管理部门为中心、各个业务和职能部门共同参与的管理架构。我国商业银行也逐渐认识到欺诈风险的危害、采取了一些相应的管控措施,但总体缺乏有效的反欺诈策略及手段,尚未建立科学合理的反欺诈监测识别系统。2020年1月我国银保监会发布《关于推动银行业和保险业高质量发展的指导意见》,强调要有效发挥大数据、人工智能等技术在打击非法集资、反洗钱、反欺诈等方面的积极作用,精准要有效防范化解银行业保险业的各类风险。由此可见,利用特征工程、机器学习(XGBoost)等方法探讨在商业银行识别企业信贷欺诈行为,对于应对当前严峻的信贷欺诈风险、遏止企业信贷欺诈行为、维护银行利益具有重要意义。

2、研究目的及意义

本项目以商业银行企业客户的真实信用信息为数据,利用特征工程提取重要特征,并基于重要特征以XGBoost方法建立商业银行针对公司客户的反欺诈模型,进一步使用机器学习库工具探索最优参数组合,完善反欺诈模型。因此,探究如何运用特征工程和XGBoost方法识别企业信贷对于商业银行防范和控制信贷欺诈风险具有较强的理论意义和现实意义。

(1)理论意义

以特征工程和XGBoost机器学习技术建立商业银行识别企业信贷欺诈的模型,能够收集整合多源数据,提取专家规则难以发现的欺诈识别特征,并通过自迭代学习来训练高维度模型,不仅有利于扩展两大技术的应用领域,也有利于完善反欺诈模型、健全银行反欺诈体系。

(2)现实意义

本项目建立的识别企业信贷欺诈的模型有助于提升商业银行对欺诈风险侦测效率,提高商业银行识别不良企业客户的能力,减少商业银行为不良企业客户提供贷款带来的欺诈损失。

3、国内外研究现状和趋势分析

信贷欺诈是指通过资料盗用、包装等方法,骗取银行贷款的行为。随着银行业、金融业的兴起,信贷风险、信贷欺诈与日俱增。由此引来不少国内外学者就如何应对信贷风险、信贷欺诈问题的深入研究。

(1)国外研究现状

国外对如何应对信贷欺诈问题的研究主要集中在欺诈风险的监测与管理和信用风险预测上。欺在欺诈风险的监测与管理方面,Carol Alexander(2003)[1]通过建立统计模型、损失分布函数等,对商业银行风险产生的原因及管理进行了研究。Chavz-Dcmoulin等(2016)[2]从战略、流程、基础设施、环境等方面研究了风险管理的要素,并提出应以智能化技术加强风险防控。Meatin T. Biegelma(2009)[3]提出了防范欺诈和内部控制的流程图。

在信用风险预测方面,Tian-Shyug Lee等人(2005)[4]使用人工神经网络和多变量自适应两阶段回归混合建模,将获得的重要变量作为神经网络模型的输入节点,建立了信用评分模型。该模型优于判别分析、逻辑回归的结果,成为处理信用评分问题的替代方案。Iain Brown等人(2012)[5]发现随机森林和梯度提升分类器在信用评分环境中表现非常好,并且能够很好地应对这些数据集中的类别不平衡问题。Chopra等人(2018)[6]问对银行真实贷款数据进行实证,以决策树为基础研究银行贷款违约,并与bagging, boosting 等集成学习技术比较。结果显示利用现代技术能够达到更高的准确性,实现精准放贷。

(2)国内研究现状

我国有关信贷欺诈的研究起步晚,仍处于较为落后的状态;但自2013年我国征信体系建设以来,逐渐涌现了一批学者在此领域深耕。肖进等人(2015[7]提出了面向缺失数据的动态分类器集成选择模型DCESM,并以两个银行信用卡业务信用评估数据集与四种常见多分类集成模型进行对比分析,结果表明DCESM模型能够取得更好的客户信用评估性能。陈云,石松(2016)[8]SVM集成学习模型应用到信用风险评估中,提出了一种混合集成模型,并以两组公开信用数据集进行测试,结果表明该混合集成能有效进行信用风险评估。 马晓君等人(2019)[9]采用PSO优化加权随机森林模型对上市公司信用进行评级,其准确率有所提高,并普遍优于传统的决策树、支持向量机和随机森林模型。夏利宇等人(2019)[10]XGBoost算法与Logistic Group Lasso模型相结合对某商业银行小微企业信贷业务数据进行实证,研究表明,该方法对贷款客户的分类效果显著优于常规方法,能够有效防控客户的违约风险。 曹志辉(2019[11]以某金融机构真实业务数据建立逻辑回归、支持向量机、AdaboostXGBoost反欺诈模型,对比分析得出XGBoost在金融反欺诈应用上的作用最优。

通过阅读整理研究国内外文献可知,现有文献有关信贷反欺诈的研究主要是以探讨信用风险、信用评估为手段,判别客户发生信贷欺诈的概率。从研究发展来看,早年间主要是利用传统统计方法对信用进行评估,侧重于信贷风险的监测与管理;而近年来,大数据、机器学习等现代技术的兴起,为信贷欺诈的研究提供了更强有力的技术手段,尤其是以逻辑回归、支持向量机、XGBoost等为主的机器学习技术在信贷欺诈判别上的应用行之有效。

4、参考文献

[1] CAlexander. Operational risk: regulation, analysis and management [M]. PearsonEducation,2003.

[2]V. ChavezDemoulin, P. Embrechts ,J. Neslehova. Quantitative models for operationalrisk: 6 extremes,dependence and aggregation[J]. Journal of Banking & Finance, 2006, 30(10): 2635-2658.

[3] Haubenstock M. The operat ional risk management framework[J]. Operat ional risk: regulation, analysis and management, Prentice Hall-Financial Times, 2003.

[4]Lee T S,Chen I F. A two -stage hybrid credit scoring model using artificial neural networks and multivariate adaptive regression splines[J]. Expert Systems with Applications, 2005,28(4): 743-752.

[5] Brown I, Mues C. An experimental comparison of clasification algorithms for imbalanced credit scoring data sets[J]. Expert Systems with Applications, 2012, 39(3): 3446 -3453.

[6] Chopra A,Bhilare P. Application of Ensemble Models in Credit Scoring Models[J] Business Perspectives and Research, 2018:227853371876553.

[7]肖进,刘敦虎,顾新,汪寿阳.银行客户信用评估动态分类器集成选择模型[J].管理科学学报,2015,18(03):114-126.

[8]陈云,石松,潘彦,俞立.基于SVM混合集成的信用风险评估模型[J].计算机工程与应用,2016,52(04):115-120.

[9]马晓君,董碧滢,王常欣.一种基于PSO优化加权随机森林算法的上市公司信用评级模型设计[J].数量经济技术经济研究,2019,36(12):165-182.

[10]夏利宇,张勇,鲁强,汤广瑞.结合XGBoost算法和Logistic回归的信用评级方法[J].征信,2019,37(11):56-59.

[11]曹志辉. 机器学习在汽车金融反欺诈模型上的应用研究[D].天津商业大学,2019.

(二)研究内容及研究目标

1、研究内容、研究目标,拟解决的关键科学技术问题

(1)研究内容

本项目以商业银行信贷欺诈危害的现实基础与信贷风险管理的理论基础上,探讨基于商业银行识别企业信贷欺诈的必要性。了解企业信贷欺诈运作流程,利用大数据对信贷欺诈行为进行全方位、多维度的监控与识别,对商业银行的企业客户的信用特征进行分析,进而运用特征工程技术提取关键特征,再利用机器学习技术(XGBoost)以关键特征数据进行建模,从而达到从信用特征判别企业客户发生信贷欺诈概率的目的,即形成信贷反欺诈事前防控机制。以此达到彻底杜绝信贷欺诈行为、充分发挥信贷反欺诈前瞻性和有效性的作用,为商业银行信贷反欺诈提供科学的参考。

(2)研究目标

本项目旨在以商业银行所遭真实骗贷案例为切入点,以商业银行真实的企业客户信贷业务为数据,利用机器学习探讨能够识别欺诈客户的方法,包括以特征工程提取企业客户关键的信用特征,以关键特征建立基于XGBoost的商业银行识别企业信贷欺诈模型,以达到推动银行业现有反欺诈模型升级转型、推动现有反欺诈体系改进、减少银行因骗贷而蒙受损失的目标。

(3)拟解决的关键科学技术问题

商业银行企业骗贷案主要包括两种表现形式:第一是外部信贷欺诈;第二是内外部合谋欺诈。这两种欺诈形式具有欺诈风险高、识别难度大的特点。本项目旨在建立一种能够达到事前防范、贷前防控、解决商业银行蒙受企业信贷欺诈损失问题的机器学习模型:

  • 外部信贷欺诈:欺诈企业的信用特征 → 特征工程选取关键特征 → XGBoost建模 → 模型应用于识别外部信贷欺诈
  • 内外部合谋欺诈:欺诈企业及银行内部内合谋人员的信用特征 → 特征工程选取关键特征 → XGBoost建模 → 模型应用于识别外部信贷欺诈

本项目拟构建的模型对两种形式的企业信贷欺诈具有通用性,唯一不同之处在于输入的关键特征不同。

 2. 项目的特色与创新之处,请比较分析

(1)技术上,运用机器学习技术(特征工程、XGBoost)为银行信贷反欺诈提供技术支撑。较现有的关于银行反企业欺诈研究而言,本项目中的技术具有更快训练速度、更高计算效率、更低内存占用及更高准确率的特点,具备大数据处理能力。

(2)理论上,采用大数据风控理论、信息不对称理论,作为探讨信贷反欺诈体系的理论支撑。

  • 大数据风控理论:是指从大数据中提炼出风险表征,并进一步转化为实时的银行风险决策服务。这一理论符合本项目的研究思路,即从企业客户的信贷特征中提取关键的特征为识别是否为欺诈客户服务。
  • 信息不对称理论:是指由于信息不对称致使交易一方蒙受损失的理论。而银行信贷欺诈的实质其实就是信息不对称,即施诈者以虚假手段诈骗银行贷款。

(3)思路上,从实际出发,以事情发展顺序为线索,分析欺诈作案手段、了解欺诈防控体系、反思其缺陷;在此基础上探讨施诈者信用特征,利用机器学习技术建模,建立事前防控机制。思路清晰,逻辑严谨。

3.拟采取的研究方案及可行性分析

(1)研究方法

本项目拟采用调查研究法、机器学习法(包括特征工程、XGBoost)以及案例研究法。

  • 调查研究法:即通过考察商业银行发生企业信贷欺诈的客观情况直接获取有关信息及数据,并对这些信息及数据进行分析的研究方法。
  • 机器学习法

特征工程:是机器学习的一种,又称为变量选择、属性选择或者变量子集选择,是在模型构建中,选择相关特征并构成特征子集的过程。本项目中用于提取企业客户信用相关的关键特征。

XGBoost:全称为 Light Gradient Boosting Machine,是一款基于决策树算法的分布式梯度提升框架。本项目拟运用XGBoost建立商业银行识别企业信贷欺诈的模型。

  • 案例研究法:是实地研究的一种,选择一个或几个场景为对象,系统地收集数据和资料,进行深入地研究,用以探讨某一现象在实际生活环境下的状况。本项目在研究后期将撰写案例参加金融专硕案例大赛,将选择一个或几个企业信贷欺诈案例进行详细深入的研究。

(2)技术路线

(3)关键技术

本项目的关键技术为特征工程和XGBoost,这两种技术都是现存的机器学习技术中较为先进和实用的技术。

  • 特征工程的优势:有效提取关键特征,使构建的模型简单而性能出色
  • XGBoost的优势:更快训练速度、更高计算效率、更低内存占用、更高准确率的特点、大数据处理能力

(4)可行性分析

  • 研究内容可行性

本项目研究商业银行如何识别企业信贷欺诈、防范银行欺诈风险,研究内容源于现实生活,且是2020年银保监会关注的重点问题,具有研究的价值和可行性。

  • 技术可行性

本项目的研究技术包括调查研究法、机器学习法(包括特征工程、XGBoost)以及案例研究法。调查研究法和案例研究法简单可行;特征工程和XGBoost为本项目建立反欺诈模型提供核心技术支撑,可通过编程软件python实现。

  • 团队可行性

我们团队由优秀的指导老师周教授以及经济研18级陈官羽和19级黄宝莲两名优秀硕士研究生组成。

指导老师:XX教授的研究领域包含本项目研究方向,并且在这方面具有一定的造诣2017年,xx教授携团队撰写案例xxx一文曾在全国金融硕士教学案例大赛中获奖;2019年,携本项目成员xxx发表核心xxx一文;另外周教授还拥有两个原创的案例库xx,xx。故xx教授能够对本项目进行深入的、针对性的指导。

团队成员:团队的同学们具备吃苦耐劳的品质和基本的科研能力。xxx曾参研2次省级大学生创新创业训练、主研大学生创新基金1次;曾获“互联网+”大学生创新创业大赛国家级铜奖、“创青青”大学生创新创业大赛四川省银奖;曾以第一作者公开发表核心1篇,合作发表SCI1区论文1篇,具有基本的科研经历和丰富的参赛经历,为本项目的正常推进奠定了基础。

4.项目进度安排

序号

时间

项目进度安排

1

2020.03-2020.03

设计本次项目的总体实施计划,并针对本项目进行理论研究

2

2020.04-2020.05

搜集商业银行企业信贷欺诈的相关案例,结合本项目研究内容,完成一篇完整的案例及案例使用说明书,并以此参加第六届(2020年)全国金融专业学位教学案例大赛

3

2020.06-2020.07

收集样本数据,利用特征工程和XGBoost建立商业银行识别企业信贷欺诈的模型,并用数据反复训练模型

4

2020.09-2020.10

根据前期理论分析以及模型,撰写本次项目的研究报告

5

2020.11-2021.12

修改、完善本次项目的研究报告,并申请结题

(三)研究基础和条件

1、与本项目有关的研究工作积累和已取得的研究工作成绩

项目指导老师XX长期从事金融教学工作,近几年参研了与本项目相关的研究,例举成果另外学校xx教授多年来围绕本学位点理论课程教学与实践课程教学相结合的理念,系统全面地建设案例库和教材库,并时刻关注经济动向,动态更新案例库,能为本项目的后期工作(尤其是以撰写案例结题)提供专业性、针对性的指导。

项目负责人xxxx及项目成员在查阅了大量的资料、文献的基础上,对项目研究内容具有深刻的认识,对研究思路具有明确的把握、并熟练掌握拟运用的关键技术。定期举行的例会加强了小组成员之间的有效交流与探讨,并在周毓萍导师的带领下,一步步地拨开未知的迷雾,厘清了研究思绪。

2、已具备的实验条件,尚缺少的实验条件和拟解决的途径

(1)文献资料齐全

武汉理工大学经济学院设有专业的图书阅览室,各类专业书籍齐全,并且具有中国知网、维普、万方、百度文库等专业文献检索平台的使用权便于我们进行理论资料的搜集。另外,百度、谷歌等搜索引擎为我们查阅商业银行企业客户信贷欺诈案例提供了便捷的渠道。

(2)软件设施完备

武汉理工大学经济学院金融硕士学位点依托软件功能,对学生进行专业培养。学院拥有省级研究基地湖北省科技创新与经济发展研究中心(STIED),校级研究中心金融科技和风险管理研究中心和金融创新与金融工程研究中心,配备有各类专业的金融学软件供学生使用。除此之外,学院还为学生提供各类金融学软件的安装服务,包括wind、matlab等数据软件,为我们案例编写过程中的数据来源提供了保障。

(3)案例建设

指导老师XX教授指导的金融专硕案例xxx荣获2020年全国金融专硕优秀案例奖。同时,多年来围绕理论课程教学与实践课程教学相结合的理念,并时刻关注经济动向,动态更新案例库,编写了XX和XX两门课程的案例库,共原创51个案例,为本项目案例的编写提供了指导思想和经验借鉴。

3、申请人和项目组主要成员的研究工作简历

列出姓名,简历,角色和任务即可

(四)研究预期成果、提交成果形式及今后拟实现预期目标计划安排准备情况。

(1)研究预期成果

  • 按照金融教指委的要求,原创有关商业银行企业信贷欺诈案例一篇,包括案例论文和案例使用说明书
  • 建立基于特征工程和XGBoost的商业银行识别企业信贷欺诈的模型

(2)提交成果形式

  • 原创的完整的案例全文及案例使用说明书(电子稿和纸质稿)

(3)拟实现预期目标计划安排准备情况

序号

时间

项目计划安排

1

2020.03-2020.03

设计本次项目的总体实施计划,并针对本项目进行理论研究

2

2020.04-2020.05

搜集商业银行企业信贷期债的相关案例,结合本项目研究内容,完成一篇完整的案例及案例使用说明书,并以此参加第六届(2020年)全国金融专业学位教学案例大赛

3

2020.06-2020.9

收集样本数据,利用特征工程和XGBoost建立商业银行识别企业信贷欺诈的模型,并用数据反复训练模型

4

2020.10-2020.12

根据前期理论分析以及模型,撰写本次项目的研究报告

5

2021.01-2021.03

修改、完善本次项目的研究报告,并申请结题

更多经验记得关注我哦~

  • 1
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

@积跬步以至千里

你的鼓励就是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值