学习知识点概要
- 逻辑回归模型
- 树模型
- 集成模型
- 模型对比与性能评估
- 模型调参
学习内容
逻辑回归模型
定义:
分类机器学习算法,将数据拟合到一个logit函数中,完成对数据发生概率的预测。
作用:
适合二分类问题
用代价函数调参:局部最优点
梯度下降法调参:全局最小值点
树模型
ID3算法
定义:
在决策树各个结点上对应信息增益准则选择特征,递归地构建决策树。
作用:
分类可视化
集成模型
GBDT
很多个基模型的线性相加,基模型为CART回归树。利用奥卡姆剃刀减枝
Xgboost
分步前向加性模型,k个基模型组成的一个加法运算式。
LightGBM
直方图算法代替预排序算法,减少计算量。
Catboost
Boosting算法的一种。是一种基于对称决策树为基学习器实现的参数较少、支持类别型变量和高准确性的GBDT框架,主要解决的痛点是高效合理地处理类别型特征,这一点从它的名字中可以看出来,CatBoost是由Categorical和Boosting组成。
模型对比与性能评估
留出法
直接将数据集划分为两个互斥的集合
交叉验证法
将数据集划分为k份,其中k-1份为训练集,1份为测试集
自助法
每次从数据集中取一个样本作为训练集中的元素,然后把该样本放回,重复该行为m次,这样我们就可以得到大小为m的训练集。
问题与解答
暂无
思考与总结
通过这次学习,我知道了金融风控中所要习得的一些数据分析模型,感觉受益匪浅。同时也意识到金融风控的困难之处,希望自己能继续学习,争取更大的进步。