- 博客(2)
- 资源 (1)
- 收藏
- 关注
原创 天池比赛打卡第三天
xgboost与随机森林的区别 为了完成比赛打开的任务也为了提升自己的理论实践能力,结合本次打卡的任务主题,回顾一下XGboost与随机森林的区别,以便更深刻的理解XGboost。 以下内容参考博文 https://blog.csdn.net/blank_tj/article/details/82453535。 随机森林的本质就是将多棵决策树组合在一起,集体进行回归与预测任务。对于分类问题就是所有数都对类别进行投票,票数最多的类别就是最终预测类别。回归问题就是对每棵树的预测值求和取平均。随机森林基于Bagg
2021-04-16 18:07:40 78
原创 二手车交易价格预测学习日记
目的二手车预测比赛数据分析 二手车预测比赛 本人首次参加机器学习类的比赛,根据赛制要求需要完成学习任务并打卡。 数据分析 在比赛任务提供的链接中下载了数据集。进过分析和查询资料,决定去掉一些不影响预测结果的数据列。 总数据量超过40w,包含31列变量信息,其中15列为匿名变量。为了保证比赛的公平性,将会从中抽取15万条作为训练集,5万条作为测试集A,5万条作为测试集B,同时会对name、model、brand和regionCode等信息进行脱敏。 具体数据列如下: SaleID - 销售样本ID name
2021-04-13 17:37:38 135
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人