2021全国大学生数学建模竞赛C题思路

本文探讨全国大学生数学建模竞赛C题,涉及小微企业信贷风险量化,通过特征工程、机器学习模型(如决策树、随机森林)预测企业违约概率,进行信贷策略制定。利用数据清洗、样本均衡、特征筛选等方法优化模型,并建议使用AHP模型进一步提升信贷风险评估的准确性。
摘要由CSDN通过智能技术生成

全国大学生数学建模竞赛即将开始,思路发布在这里
https://mathmodel.lanzoui.com/s/cumcm
C题 中小微企业的信贷决
1.量化分析,即将一个目标 用 具 体的 数 值 表 示 出 来,对 应 于 第一问 就是将每个企业的信贷风险用一个具体的值表示出来。
2.《企业信息》中只给了企业名称和信誉等级(自变量),最关键的是是否违约(因变量),学过机器学习的同学应该知道,题目的言下之意很明显需要你建立一个预测模型,预测企业违约的可能性有多大。
3.但是表一给的特征非常有限,这个时候就需要从特征工程入手,从后面两张表中提取出我们所需要的特征(查询相关资料)。
给大家列举已经做出来的几个:进项有效发票数、进项作废发票数、销项有效发票数、销项作废发票数、负数发票次数、负数发票次数占比、企业交易金额、交易时长(月份),平均每月交易次数、平均每月交易金额。涉及到平均主要是因为企业交易次数少,有违约的和没有违约的,所以单从次数和金额上不好判断。其它特征小编不一一解释了,自己查资料理解。
4.有了这些特征,那我们就可以建议预测模型《企业信息》中的信息就是模型的训练样本。在这里小编推荐使用决策树、随机森林、Xgboost、LightGBM这几种模型。在编写代码的时候,设置这些模型的预测结果为企业是否违约(1或者0),并将输出结果以概率的式显示(例如:低于0.5为没有违约,高于0.5为违约)。特别提醒,一定要设置随机数,不然结果会发生改变。  5.有了第4步的结果,而且在保证预测精度的情况下,就可以将企业违约概率从高到低进行排序,再将概率值分为5级或者8级,并画出

  • 10
    点赞
  • 21
    收藏
    觉得还不错? 一键收藏
  • 6
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 6
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值