金融风控数据挖掘-Task4

本文介绍了金融风控领域的数据挖掘模型,包括逻辑回归、决策树和集成模型如随机森林、GBDT等,讨论了模型的优缺点。同时,讲解了模型评估方法如训练集测试集划分、交叉验证和自助法,以及模型调参的贪心策略、网格搜索和贝叶斯调参方法。
摘要由CSDN通过智能技术生成


本学习笔记为阿里云天池龙珠计划Docker训练营的学习内容,学习链接为:https://tianchi.aliyun.com/specials/activity/promotion/aicampdocker

一、学习知识点概要:

主要描述金融风控领域常用的机器学习模型以及调参的算法原理,具体的代码参考金融风控训练营

二、学习内容:

1、逻辑回归

  1. 优点
    ①训练速度较快,分类的时候,计算量仅仅只和特征的数目相关;
    ②简单易理解,模型的可解释性非常好,从特征的权重可以看到不同的特征对最后结果的影响;
    ③适合二分类问题,不需要缩放输入特征;
    ④内存资源占用小,只需要存储各个维度的特征值;
  2. 缺点
    ①逻辑回归需要预先处理缺失值和异常值;
    ②不能用Logistic回归去解决非线性问题,因为Logistic的决策面是线性的;
    ③对多重共线性数据过于敏感,且很难处理数据不平衡的问题;
    ④准确率并非很高,因为形式非常简单,很难去拟合数据的真实分布;

2、决策树模型

  1. 优点

①简单直观,生成的决策树可以可视化展示
②数据不需要预处理,不需要归一化,不需要处理缺失数据<

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值