比赛
rocketeerLi
自由地努力着
展开
-
datawhale 学习笔记——模型融合入门
前言这是 datawhale 数据挖掘学习的最后一次打卡——模型融合,内容很好理解,就是将训练出来的多个模型融合在一起,集成,形成一个效果更好的模型。这次的任务基本上是比较独立的,既没有用到 task3 的特征工程内容,也没有用到 task4 中创建的模型,相对比较独立。不过这次打卡不打算粘贴什么代码了,代码全都在教程里,这里只记录一下我的理解。简而言之,模型的融合方法大致有以下三种:加...原创 2020-04-03 23:29:30 · 497 阅读 · 0 评论 -
datawhale 学习笔记——建模调参入门
前言居然又拖到了最后一天才开始打卡,。果然 ddl 是第一生产力。放上这次的教程链接:Datawhale 零基础入门数据挖掘-Task4 建模调参看标题就知道这次的这次的内容是建模和调参。虽然说是零基础入门系列,但是这次的教程对真的零基础的人来讲并不是很友好,还是需要很多前置知识的。主要是机器学习模型方面的教程,教程里给出了几篇作者写的文章。个人感觉需要一定门槛,如果看不懂建议参考其他的。...原创 2020-04-01 19:52:45 · 668 阅读 · 0 评论 -
datawhale 学习笔记——特征工程入门
特征工程介绍我理解的特征工程是一种更深层的数据分析,为特定的数据做处理,深挖其中的信息,以便后续模型得到更好的效果。本文是参考天池二手车预测比赛的教程——特征工程做的笔记,task3 中提到了很多特征处理的方法,主要介绍了其中的五种方法:异常数据处理特征构造数据分桶特征归一化特征筛选首先,导入需要的包,并载入...原创 2020-03-28 18:34:25 · 508 阅读 · 0 评论 -
datawhale 学习笔记——数据分析入门
写在前面(这部分是废话)这是参加 datawhale 数据挖掘的第一次打卡,打卡内容是数据分析,希望自己能坚持做下去。开始的时候,第一天看了一下题目背景,运行了一下 baseline,刚好中期报告要改,就放下了。今天在这里做一下数据分析这部分的笔记。介绍本文主要是根据天池上的教程进行学习的,一些不理解地方做了笔记,内容没有教程全,附上教程链接:Datawhale 零基础入门数据挖掘-Task...原创 2020-03-24 18:59:35 · 1149 阅读 · 0 评论