本学习笔记为阿里云天池龙珠计划Docker训练营的学习内容,学习链接为:https://tianchi.aliyun.com/specials/activity/promotion/aicampdocker
一、学习知识点概要:
主要描述金融风控领域常用的机器学习模型以及调参的算法原理,具体的代码参考金融风控训练营
二、学习内容:
1、逻辑回归
- 优点
①训练速度较快,分类的时候,计算量仅仅只和特征的数目相关;
②简单易理解,模型的可解释性非常好,从特征的权重可以看到不同的特征对最后结果的影响;
③适合二分类问题,不需要缩放输入特征;
④内存资源占用小,只需要存储各个维度的特征值; - 缺点
①逻辑回归需要预先处理缺失值和异常值;
②不能用Logistic回归去解决非线性问题,因为Logistic的决策面是线性的;
③对多重共线性数据过于敏感,且很难处理数据不平衡的问题;
④准确率并非很高,因为形式非常简单,很难去拟合数据的真实分布;
2、决策树模型
- 优点
①简单直观,生成的决策树可以可视化展示
②数据不需要预处理,不需要归一化,不需要处理缺失数据<