自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 收藏
  • 关注

转载 Datawhale-河北高校邀请赛-二手车回归预测-task5-模型融合

5.模型融合 模型融合目标 对于多种调参完成的模型进行模型融合 完成对于多种模型的融合,提交融合结果并打卡 内容介绍 简单加权融合 回归(分类概率):算术平均融合(Arithmetic mean), 几何平均融合(Geometric mean) 分类:投票(Voting) 综合:排序融合(Rank averaging),log融合 stacking/blending: 构建多层模型,并利用预测结果再拟合预测。 boosting/bagging(再xgboost,Adaboost,GBDT中

2021-04-23 23:55:36 218

转载 Datawhale-河北高校邀请赛-二手车回归预测-task4模型调参

DataWhale 河北邀请赛-task4模型调参 建模与调参 学习目标 了解常用的机器学习模型,并掌握机器学习模型的建模与调参流程 完成相应学习打卡任务 内容介绍 线性回归模型 线性回归对于特征的要求 处理长尾分布 理解线性回归模型 模型性能验证 评价函数与目标函数 交叉检验方法 留一验证方法 针对时间序列问题的验证 绘制学习率曲线 绘制验证曲线 嵌入式特征选择 Lasso回归 Ridge回归 决策树 模型对比 常用线性模型 常用非线性模型 模型调参 贪心调参方法 网格调参

2021-04-20 17:25:42 99

转载 DataWhale-河北高校邀请赛-task3-特征构造

特征工程 特征工程目标 对于特征进行进一步分析,并对数据进行处理; 尝试构造新特征,使用模型预测结果检验其价值; 完成对于特征工程的分析,并对数据进行一些图标或者文字总结并打卡; 内容介绍 常见特征工程包括: 异常处理: 通过箱型图|3-sigma 识别异常值,并对其进行替换 BOX-COX转换(处理有偏分布) 长尾截断 特征归一化|标准化: 标准化(当成正态分布,将其标准正态化) 归一化(转换到【0,1】区间) 针对幂律分布,可以采用公式:log((1+x)/ (1+median))

2021-04-20 00:40:27 118

原创 Datawhale组队学习-河北高校邀请赛-天天向上-天天-task2

天天向上小队-天天,task2,EDA学习笔记 目录数据处理总结数据探索性分析数据分布可视化name:汽车交易名称,已脱敏model:车型编码,已脱敏brand:汽车品牌,已脱敏bodyType:车身类型fuelType:燃油类型gearbox:变速箱power:发动机功率kilometers:汽车已行驶公里数notRepairedDamage:汽车有尚未修复的损坏regDate:注册日期creatDate:汽车上线时间,即开始售卖时间regionCode:地区编码,已脱敏price:汽车交易价格v_0 ~

2021-04-16 19:16:37 275

转载 天天向上小队-天天,task1笔记

本贴为Datawhale河北邀请赛组队学习的学习笔记,原文章详见:https://tianchi.aliyun.com/notebook-ai/detail?postId=95456 赛题理解 比赛:河北高校邀请赛-二手车交易价格预测,大赛组织为Datawhale 和 Tianchi天池 地址:https://tianchi.aliyun.com/competition/entrance/531858/introduction 比赛任务是预测二手车交易价格,属于回归问题,数据来自某交易平台二.

2021-04-12 12:13:42 103

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除