xgboost算法 c语言,实战微博互动预测之三_xgboost答疑解惑

最新推荐文章于 2021-08-18 10:26:04 发布

weixin_39860349

最新推荐文章于 2021-08-18 10:26:04 发布

阅读量578

点赞数

文章标签： xgboost算法 c语言

1. 说明

前两篇完成了特征工程的相关工作：加入用户的统计特征，分析文本信息内容，并作为新特征加入了数据集。

本篇我们来看看算法，实战微博互动预测(后简称本例)的评估算法如下：

公式中f代表转发，c代表评论，l代表赞，p代表预测，r代表真实值；deviation是真实值与预测值的偏差，具体公式如下：

precision是准确率，根据偏差算出：

sig为符号函数，当x>0时sig(x)=1，当x<=0时，sig(x)为0。Counti为每篇的反馈总数，当Counti>100时，以按100计算。

与大多数评估算法不同，本例中每个实例有不同权重，反馈越多实例权重越大。而我们常用的算法比如GBDT是根据误差迭代改进的，默认情况下各实例权重是一样的，这块儿需要单独处理一下。

具体算法还是使用xgboost库，之前看到的大多数关于xgboost的文章，要么是讲数学原理，要么是

最低0.47元/天解锁文章

weixin_39860349

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
xgboost算法 c语言,实战微博互动预测之三_xgboost答疑解惑

1. 说明前两篇完成了特征工程的相关工作：加入用户的统计特征，分析文本信息内容，并作为新特征加入了数据集。本篇我们来看看算法，实战微博互动预测(后简称本例)的评估算法如下：公式中f代表转发，c代表评论，l代表赞，p代表预测，r代表真实值；deviation是真实值与预测值的偏差，具体公式如下： precision是准确率，根据偏差算出： sig为符号函数，当x>0时sig(x)=1，当x&l...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。