数据挖掘实战
文章平均质量分 79
CannonJia
热爱所热爱,奉行终身成长。
展开
-
数据挖掘实战--二手车交易价格预测(五)模型融合
模型融合目标 对于多次调参完成的模型进行模型融合 内容介绍 简单加权融合: 1) 回归:(分类概率):算术平均融合(Arithmetic mean),几何平均融合(Geometric mean); 2) 分类:投票(Voting) 3)综合:排序融合(Rank averaging),log融合 4)Stacking融合 构建错层模型,利用预测结果再拟合 多树的提升方法 简单加权融合 利用算数平...原创 2020-04-04 18:25:27 · 580 阅读 · 1 评论 -
数据挖掘实战--二手车交易价格预测(四)建模调参
建模调参的过程中,尝试了两种不同的调参方式——贪心调参和贝叶斯调参。 最近事情太多,就划个水给自己记录一下即可。 贪心调参 把求解的问题分成若干个子问题;对每个子问题求解,得到子问题的局部最优解;把子问题的解局部最优解合成原来问题的一个解。 objective = ['regression', 'regression_l1', 'mape', 'huber', 'fair'] num_leave...原创 2020-04-01 20:54:42 · 592 阅读 · 0 评论 -
数据挖掘实战--二手车交易价格预测(二)数据探索性分析(EDA)
包的安装: 采用Anaconda 3进行代码的编译,Anaconda 3里基础的数据分析包都已经准备好,我们需要安装的就是sklearn,lightgbm和xgboost包。 Anaconda可以支持我们采取多种方式安装所需要的包。可以采用pip,conda和从PYPI下载相关包等方式。这里采用的是pip方式。 pip install scikit-learn pip install lightg...原创 2020-03-24 00:02:02 · 924 阅读 · 0 评论 -
数据挖掘实战--二手车交易价格预测(一)
数据挖掘实战–二手车交易价格预测(一) 疫情影响,约好的实习去不成了。在家充电势在必行,有在DataWhale内部的同学推荐参加这个数据挖掘的训练营。想着自己从18年,就断断续续的想入ML的坑,刚好系统性的梳理一下自己的知识点。而且打卡形式是用Blog的方式,刚好克服一下自己的惰性。无数次的想写,写了100个字就又丢回草稿箱吃灰了。希望自己能把这两周坚持下来,养成随手记Blog的习惯。 赛题理解 ...原创 2020-03-21 14:22:56 · 2027 阅读 · 0 评论