![](https://img-blog.csdnimg.cn/555fb0465d764778a4798a5ccbc9e221.png?x-oss-process=image/resize,m_fixed,h_224,w_224)
|机器学习|
文章平均质量分 65
机器学习
alexliu2360
后端/推荐系统/推荐算法
展开
-
【金融风控-贷款违约预测1】赛题理解
一、赛题赛题以预测用户贷款是否违约为任务,数据集报名后可见并可下载,该数据来自某信贷平台的贷款记录,总数据量超过120w,包含47列变量信息,其中15列为匿名变量。为了保证比赛的公平性,将会从中抽取80万条作为训练集,20万条作为测试集A,20万条作为测试集B,同时会对employmentTitle、purpose、postCode和title等信息进行脱敏。字段表Field Descriptionid 为贷款清单分配的唯一信用证标识loanAmnt 贷款金额term 贷款期限(year原创 2020-09-15 23:05:38 · 500 阅读 · 0 评论 -
【XGBoost】xgb模型调参
1.模型评估(重点看一下)主要评估指标包括:开发的模型评估模块:支持输出ROC曲线,AP曲线以及特征重要度柱状图等.生成的特征重要度柱状图,可以看到不同特征的权重,排名越高说明该特征对决策影响越大。此外,评估特征好坏还有一个小trick,即观察该柱状图的边界是否平滑,这个弧线越平滑,说明特征选取的越准确越丰满。如下图所示,根据排名,可以相应找到对应的特征,评估后结果比较合理。但边界还是不够平滑,说明特征还可以继续丰满。2.模型调参2.1常用的可调参数eta[default=0.3]——和GBM中原创 2021-10-29 15:22:03 · 2269 阅读 · 0 评论 -
【GBDT】常见问题
GBDT基于哪种树模型?基于CART的回归树GBDT是分类树还是回归树?为什么是回归树,基于CART回归树,每一个弱分类器的输出(预测值y^\hat{y}y^)需要和真实值yyy得到残差,作为下一个弱分类器的输入,因此必须是回归树分类树可以通过转换为预测概率值,得到分类结果梯度提升和梯度下降的区别和联系是什么 ?在梯度下降中, 模型是以参数化形式表示, 从而模型的更新等价于参数的更新;在梯度提升中, 模型并不需要进行参数化表示, 而是直接定义在函数空间中, 从而大大..原创 2021-08-31 21:42:24 · 228 阅读 · 0 评论 -
【机器学习】逻辑回归
1、公式推导1.1、sigmoid 函数定义:y = 1/(1+exp(-x)) \Gamma(y)=\frac{1}{1+e^{-x}}python实现:def sigmoid(t): return 1. / (1. + np.exp(-t)) x = np.linspace(-10, 10, 500)plt.plot(x, sigmoid(x))plt.show()1.1、损失函数1.2、梯度1.3、核心算法伪代码2、手动实现LR代码3、sklearn LR ap原创 2020-12-23 20:02:12 · 457 阅读 · 1 评论 -
【基础】K近邻算法
1.基本介绍K最近邻(k-Nearest Neighbor,KNN)分类算法,是一个理论上比较成熟的方法,也是最简单的机器学习算法之一。该方法的思路是:如果一个样本在特征空间中的k个最相似(即特征空间中最邻近)的样本中的大多数属于某一个类别,则该样本也属于这个类别。KNN算法中,所选择的邻居都是已经正确分类的对象。该方法在定类决策上只依据最邻近的一个或者几个样本的类别来决定待分样本所属的类别。...原创 2019-12-17 19:09:16 · 579 阅读 · 0 评论