- 博客(5)
- 收藏
- 关注
转载 Datawhale-河北高校邀请赛-二手车回归预测-task5-模型融合
5.模型融合 模型融合目标 对于多种调参完成的模型进行模型融合 完成对于多种模型的融合,提交融合结果并打卡 内容介绍 简单加权融合 回归(分类概率):算术平均融合(Arithmetic mean), 几何平均融合(Geometric mean) 分类:投票(Voting) 综合:排序融合(Rank averaging),log融合 stacking/blending: 构建多层模型,并利用预测结果再拟合预测。 boosting/bagging(再xgboost,Adaboost,GBDT中
2021-04-23 23:55:36 218
转载 Datawhale-河北高校邀请赛-二手车回归预测-task4模型调参
DataWhale 河北邀请赛-task4模型调参 建模与调参 学习目标 了解常用的机器学习模型,并掌握机器学习模型的建模与调参流程 完成相应学习打卡任务 内容介绍 线性回归模型 线性回归对于特征的要求 处理长尾分布 理解线性回归模型 模型性能验证 评价函数与目标函数 交叉检验方法 留一验证方法 针对时间序列问题的验证 绘制学习率曲线 绘制验证曲线 嵌入式特征选择 Lasso回归 Ridge回归 决策树 模型对比 常用线性模型 常用非线性模型 模型调参 贪心调参方法 网格调参
2021-04-20 17:25:42 99
转载 DataWhale-河北高校邀请赛-task3-特征构造
特征工程 特征工程目标 对于特征进行进一步分析,并对数据进行处理; 尝试构造新特征,使用模型预测结果检验其价值; 完成对于特征工程的分析,并对数据进行一些图标或者文字总结并打卡; 内容介绍 常见特征工程包括: 异常处理: 通过箱型图|3-sigma 识别异常值,并对其进行替换 BOX-COX转换(处理有偏分布) 长尾截断 特征归一化|标准化: 标准化(当成正态分布,将其标准正态化) 归一化(转换到【0,1】区间) 针对幂律分布,可以采用公式:log((1+x)/ (1+median))
2021-04-20 00:40:27 118
原创 Datawhale组队学习-河北高校邀请赛-天天向上-天天-task2
天天向上小队-天天,task2,EDA学习笔记 目录数据处理总结数据探索性分析数据分布可视化name:汽车交易名称,已脱敏model:车型编码,已脱敏brand:汽车品牌,已脱敏bodyType:车身类型fuelType:燃油类型gearbox:变速箱power:发动机功率kilometers:汽车已行驶公里数notRepairedDamage:汽车有尚未修复的损坏regDate:注册日期creatDate:汽车上线时间,即开始售卖时间regionCode:地区编码,已脱敏price:汽车交易价格v_0 ~
2021-04-16 19:16:37 275
转载 天天向上小队-天天,task1笔记
本贴为Datawhale河北邀请赛组队学习的学习笔记,原文章详见:https://tianchi.aliyun.com/notebook-ai/detail?postId=95456 赛题理解 比赛:河北高校邀请赛-二手车交易价格预测,大赛组织为Datawhale 和 Tianchi天池 地址:https://tianchi.aliyun.com/competition/entrance/531858/introduction 比赛任务是预测二手车交易价格,属于回归问题,数据来自某交易平台二.
2021-04-12 12:13:42 103
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人