比赛
-Helslie
这个作者很懒,什么都没留下…
展开
-
[比赛]二手车交易价格预测-模型融合
一、模型的结果层面的融合回归任务中的加权融合根据各个模型的最终预测表现分配不同的权重以改变其对最终结果影响的大小。对于正确率低的模型给予更低的权重,而正确率更高的模型给予更高的权重。分类任务中的Voting基本思想是选择所有机器学习算法当中输出最多的那个类。二、其他融合BoostingBoosting是一种将各种弱分类器串联起来的集成学习方式,每一个分类器的训练都依赖于前一个分类器的...原创 2020-04-04 18:01:44 · 262 阅读 · 0 评论 -
[比赛]二手车交易价格预测-建模调参
1.交叉验证首先说明交叉验证的含义,在使用训练集对参数进行训练的时候,经常会发现人们通常会将一整个训练集分为三个部分(比如mnist手写训练集)。一般分为:训练集(train_set),评估集(valid_set),测试集(test_set)这三个部分。这其实是为了保证训练效果而特意设置的。其中测试集很好理解,其实就是完全不参与训练的数据,仅仅用来观测测试效果的数据。而训练集和评估集则牵涉到下...原创 2020-04-01 11:25:02 · 384 阅读 · 0 评论 -
[比赛]新冠期间饿了么骑士行为预估-数据理解
写在前面饿了么的比赛的赛题数据理解。一、骑士行为数据courier_id 骑士idwave_index 波次indextracking_id 订单idcourier_wave_start_lng 波次起始时刻骑士位置courier_wave_...原创 2020-03-30 21:20:40 · 2397 阅读 · 44 评论 -
[比赛]二手车交易价格预测-特征工程
今天直接步入正题!1.数据准备# 准备数据train_y = train['price']del train['price']data = pd.concat([train, test], axis=0)data.set_index('SaleID', inplace=True)# 按类型划分数据numeric_features = ['power','kilometer','...原创 2020-03-28 15:47:17 · 199 阅读 · 0 评论 -
[比赛]二手车交易价格预测-EDA
1.写在前面跟着 Datawhale 报名了天池的数据挖掘比赛,但是这几天恰逢ddl超多,所以最后急急忙忙赶着来做第一部分,感觉这种一起学习的氛围很好吧~本篇的话应该是借鉴了大佬AI蜗牛车的baseline,以及群内很多小伙伴的笔记,我挑了一个没想到就是大佬!哈哈哈!今天早上讨论班讲的也不是很好,下午作业做的也不是很顺,感觉很多时候都是充斥在自己不喜欢的东西里面,囫囵吞枣混过去了,希望慢慢的能...原创 2020-03-24 20:49:58 · 292 阅读 · 0 评论