数据挖掘
weixin_42295319
这个作者很懒,什么都没留下…
展开
-
task5模型融合
模型融合目标对于多种调参完成的模型进行模型融合。完成对于多种模型的融合,提交融合结果并打卡。内容介绍模型融合是比赛后期一个重要的环节,大体来说有如下的类型方式简单加权融合:回归(分类概率):算术平均融合(Arithmetic mean),几何平均融合(Geometric mean);分类:投票(Voting)综合:排序融合(Rank averaging),log融合stackin...原创 2020-04-04 21:57:04 · 488 阅读 · 0 评论 -
task4建模调参
task4建模调参线性回归模型:线性回归对于特征的要求;处理长尾分布;理解线性回归模型;模型性能验证:评价函数与目标函数;交叉验证方法;在使用训练集对参数进行训练的时候,经常会发现人们通常会将一整个训练集分为三个部分(比如mnist手写训练集)。一般分为:训练集(train_set),评估集(valid_set),测试集(test_set)这三个部分。这其实是为了保证训练效果而特...原创 2020-04-01 21:19:46 · 156 阅读 · 0 评论 -
task3特征工程
特征工程常见的特征工程包括:异常处理:通过箱线图(或 3-Sigma)分析删除异常值;# 这里我包装了一个异常值处理的代码,可以随便调用。def outliers_proc(data, col_name, scale=3): """ 用于清洗异常值,默认用 box_plot(scale=3)进行清洗 :param data: 接收 pandas 数据格式 ...原创 2020-03-28 18:56:29 · 88 阅读 · 0 评论 -
数据挖掘竞赛
天池二手汽车预测赛_task1数据挖掘评估性能度量回归任务性能度量分类任务性能度量数据挖掘评估性能度量对学习器的泛化性能进行评估,不仅需要有效可行的实验估计方法,还需要有衡量模型泛化能力的评价标准,这就是性能度量(performance measure).回归任务性能度量在预测任务中,给定样例集D={(x1,y1),(x2,y2),...,(xm,ym)} D=\{(x_1,y_1),(x...原创 2020-03-24 21:15:59 · 127 阅读 · 0 评论