自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 收藏
  • 关注

原创 DataWhale数据挖掘学习--Task 5 模型融合

不知不觉来到了最后一个任务,模型融合。想要提升模型的表现,模型融合是很好的方法之一,也是比赛后期一个重要的环节。模型融合通常有以下方式:简单加权融合:(1)回归(分类概率):算术平均融合(Arithmetic mean),几何平均融合(Geometric mean);(2)分类:投票(Voting)(3) 综合:排序融合(Rank averaging),log融合stacking...

2020-04-03 20:12:31 273

原创 Datawhale数据挖掘学习--Task 4 建模调参

建模调参4.1线性回归模型4.1.1读取数据4.1.2简单建模4.1.3查看预测情况4.1.4长尾分布处理4.2模型性能验证4.2.1五折交叉验证4.2.2模拟真实业务情况4.2.3绘制学习率曲线与验证曲线4.3嵌入式特征选择4.3.1 三种方法的对比一般回归L2正则L1正则4.4模型对比4.5模型调参4.5.1 贪心算法4.5.2 网格调参4.5.3 贝叶斯调参总结在特征工程的之后便是需要我们...

2020-03-31 20:04:53 250

原创 DataWhale数据挖掘学习--Task 3 特征工程

特征工程3.1 数据理解3.2 数据清洗3.2.1 异常值处理3.2.2 缺失值处理删除(Deletion)均值/众数/中位数填充使用预测模型KNN填充3.3 特征构造构造车辆已使用时间(特征组合)城市信息(变量变换)品牌信息(统计)数据分桶非线性变换无量纲化(最大最小标准化)对类别特征进行 OneHotEncoder3.4 特征选择3.4.1过滤式相关性分析3.4.2包裹式3.4.3嵌入式经过...

2020-03-27 20:43:16 266

原创 DataWhale数据挖掘学习--Task 2 数据分析

数据挖掘学习任务二是对数据进行EDA–数据性探索分析。EDA定义:探索性数据分析(Exploratory Data Analysis,简称EDA),是指对已有的数据(特别是调查或观察得来的原始数据)在尽量少的先验假定下进行探索,通过作图、制表、方程拟合、计算特征量等手段探索数据的结构和规律的一种数据分析方法。通过EDA,我们可以更好的了解和熟悉数据集,方便接下来的机器学习或深度学习使用。...

2020-03-23 21:55:38 462

原创 DataWhale数据挖掘学习---Task 1

一、赛题查看与理解赛题 前往 https://tianchi.aliyun.com/competition/entrance/231784/introduction查看题目,了解评分体系,并下载训练数据到本地。赛题是一个典型的回归问题。 赛题目标:以二手车市场为背景,要求选手预测二手汽车的交易价格。 评价标准:数据特征:二、查看数据概况利用pandas读取数...

2020-03-21 16:51:29 193

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除