面经-机器学习

本文探讨了机器学习中的关键评估指标,如ROC曲线及其AUC,解释了FPR和TPR的概念,并强调了AUC在判断模型性能中的作用。同时,介绍了GMM高斯混合模型,它是如何利用EM算法来拟合数据分布的。此外,还提及了xgboost作为提升算法的工作原理,强调了其在残差拟合上的应用。
摘要由CSDN通过智能技术生成

ROC 曲线 & AUC

横坐标为假正,纵坐标为真正

在这里插入图片描述
越接近1越好,(0,0)表示都预测成负,(1,1)表示都预测成正
而FPR(False Positive Rate)= FP /(FP + TN),即负类数据被分为正类的比例

TPR(True Positive Rate)= TP /(TP + FN),即正类数据被分为正类的比例

AUC(Area Under Curve)被定义为ROC曲线下与坐标轴围成的面积,显然这个面积的数值不会大于1。 又由于ROC曲线一般都处于y=x这条直线的上方,所以AUC的取值范围在0.5和1之间。 AUC越接近1.0,检测方法真实性越高;等于0.5时,则真实性最低,无应用价值。

GMM 高斯混合模型


GMM

在这里插入图片描述

k 个高斯分布拟合样本分布,加权得到结果
EM算法:
在这里插入图片描述

xgboost

xgboost
boost算法,先用一个树预测,然后再取树对残差做拟合:
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
去掉常数后:
在这里插入图片描述
评分:
Gj :叶子结点 j 所包含样本的一阶偏导数累加之和,是一个常量;
Hj :叶子结点 j 所包含样本的二阶偏导数累加之和,是一个常量;
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

在这里插入图片描述

EM算法

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值