- 博客(5)
- 收藏
- 关注
原创 DW数据挖掘组队学习——task5 模型融合
检查仍在持续,可怜我的清明节又白扯了,先摘抄下来打卡,后天忙完了再补学吧5.1 模型融合目标 对于多种调参完成的模型进行模型融合。 完成对于多种模型的融合,提交融合结果并打卡。 5.2 内容介绍模型融合是比赛后期一个重要的环节,大体来说有如下的类型方式。简单加权融合: 回归(分类概率):算术平均融合(Arithmetic mean),几何平均融合(Ge...
2020-04-04 20:00:59
111
原创 二手车价格预测数据挖掘学习—Task4
这几天迎接上级检查组,工作冲突特别大,因此功课落下有点多,连直播课都没有听到。晚上突击了一下,先把卡打了,回头清明节再好好研究一下这一部分内容。一、学习目标了解常用的机器学习模型,并掌握机器学习模型的建模与调参流程二、学习到的内容1.线性回归模型:线性回归对于特征的要求;处理长尾分布;理解线性回归模型;2.模型性能验证:评价函数与目标函数;交叉验证方法;留一验证方法;针对时...
2020-04-01 20:27:43
103
原创 DW组队学习-二手车交易价格预测-Task3
今天开始学习task-3,全程看了直播讲解,不过效果一般,主要问题在于很多概念还不懂,重新查阅了相关资料,总结如下: 一、什么是特征工程 特征工程是将原始数据转换为更能代表预测模型的潜在问题的特征的过程,可以通过挑选最相关的特征,提取特征以及创造特征来实现。其中创造特征又经常以降维算法的方式实现。 可能面对的问题有:特征之间有相关性,特征和标签无关,特征太多或太小,或者干脆就无法表现出应有...
2020-03-28 20:30:23
76
原创 DW组队学习-二手车交易价格预测-Day2
Task2 数据分析今天开始学习Task-2部分,主要是EDA-数据探索性分析的相关讲解。探索性数据分析(Exploratory Data Analysis,简称EDA),是指对已有的数据(特别是调查或观察得来的原始数据)在尽量少的先验假定下进行探索,通过作图、制表、方程拟合、计算特征量等手段探索数据的结构和规律的一种数据分析方法。针对本次赛题,今天主要根据自学材料学习试验了以下内容:1.载入...
2020-03-21 23:26:49
211
原创 DW组队学习-二手车交易价格预测
数据挖掘 - 二手车交易价格预测Task-1 赛题理解1.赛题概况赛题的任务是预测二手车的交易价格,数据集来自某交易平台的二手车交易记录,总数据量超过40w,包含31列变量信息,其中15列为匿名变量。其中15万条作为训练集,5万条作为测试集A,5万条作为测试集B。数据示例如下:train.csvSaleID - 销售样本IDname - 汽车编码regDate - 汽车注册时间mo...
2020-03-21 10:21:24
107
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人