学习笔记：XGB算法与SGB算法开发实践

最新推荐文章于 2025-04-25 17:16:24 发布

What_can_l_say

最新推荐文章于 2025-04-25 17:16:24 发布

阅读量393

点赞数 3

文章标签：学习笔记

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/What_can_l_say/article/details/139690319

版权

学习笔记：

一、背景-纵向数据分割场景和树模型
1. 纵向树模型是基于纵向分割数据集训练的决策树模型，相同样本在不同特征维度上进行训练。
2. 通常需要前置求交集，SS-XGB/SGB XGB有优势的场景包括提高AUC、合作完成建模以及更多数据->更多价值等。
3. 纵向联合建模需要考虑数据、算法和可解释性等因素。

二、使用-隐语纵向树模型
1. 隐语提供的纵向树模型算法实现了XGB的经典功能，采用MPC进行密态计算，无信息泄漏，可证安全。
2. 网络条件好时效率高，支持SS-XGB和SecretShared ExtremeGradientBoost两种算法。

三、原理和实现-从理论到工程
1. SS-XGB/SGB算法是如何炼成的？经典算法到MPC算法需要进行算法改造三部曲，确定保护的数据部分、准备安全原语和改造数据结构和算法。
2. 如何修改源码实现合适的功能？开发实战包括组件封装、算法修改和模型导出三部曲。
3. SS-XGB / SGB 在隐语实现有什么独特优势？隐语的优势包括提供设备抽象、重点算子优化破瓶颈、分层架构和开源共建。

四、实践
1. 用ss-XGB来完成刚才老师演示的SGB流程。
2. 当用ss-XGB跑完相同的流程后，它的test AUC是多少？
3. 如果Alice有15个特质，Bob有1个特质，如果用SGB和ss-XGB做联合建模，我们是否还会获得额外的 AUC的收益？

提示：
1. 查看ss xgb的文档和教程。
2. 可以使用Python Pandas包在本地拆分数据，然后将文件上传到Alice或Bob。

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。