数据挖掘
fengshiyu1997
一个研二计科在读小菜鸡
展开
-
零基础入门数据挖掘-二手车交易价格预测(Day4模型融合)
最后的时刻模型融合目标内容介绍Stacking相关理论介绍什么是 stacking如何进行 stackingStacking的方法讲解代码示例回归\分类概率-融合:Tip:此部分为零基础入门数据挖掘的 Task5 模型融合 部分,带你来了解各种模型结果的融合方式,在比赛的攻坚时刻冲刺Top,欢迎大家后续多多交流。模型融合目标对于多种调参完成的模型进行模型融合。完成对于多种模型的融合,提交融...原创 2020-04-04 19:22:11 · 483 阅读 · 0 评论 -
零基础入门数据挖掘-二手车交易价格预测(Day3建模调参)
目录减少数据在内存中占用的空间线性回归 & 五折交叉验证 & 模拟真实业务情况简单建模五折交叉验证事实上,五折交叉验证在某些与时间相关的数据集上反而反映了不真实的情况绘制学习率曲线与验证曲线嵌入式特征选择 - 大部分情况下都是用嵌入式做特征选择# 我们看下三种模型的效果对比:线性回归; 加入了L1的Lasso回归; 加入了L2的岭回归减少数据在内存中占用的空间def reduc...原创 2020-04-01 15:34:06 · 739 阅读 · 1 评论 -
零基础入门数据挖掘-二手车交易价格预测(Day2特征工程)
文章内容摘录自atawhale 零基础入门数据挖掘-Task3 特征工程特征工程目标对于特征进行进一步分析,并对于数据进行处理完成对于特征工程的分析,并对于数据进行一些图表或者文字总结并打卡。常见的特征工程异常处理:通过箱线图(或 3-Sigma)分析删除异常值;BOX-COX 转换(处理有偏分布);长尾截断;特征归一化/标准化:标准化(转换为标准正态分布);归一化(抓...原创 2020-03-28 00:49:50 · 419 阅读 · 0 评论 -
零基础入门数据挖掘-二手车交易价格预测(Day1数据分析)
零基础入门之数据分析开题语赛题数据字段表评价标准探索性数据分析探索性数据分析的计划基础操作(jupyter notebook环境下)读csv数据输出数据的大小信息浏览数据查看简要信息查看列名数据统计信息浏览查看价格相关性分析结语开题语参加比赛的第一件事不是下数据,跑模型,而是要先静下心来读题,磨刀不误砍柴工。赛题数据赛题以预测二手车的交易价格为任务,该数据来自某交易平台的二手车交易记...原创 2020-03-24 18:19:03 · 1873 阅读 · 1 评论