自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 收藏
  • 关注

原创 模型融合

模型融合,如果是分类问题用voting解决 。如果是回归问题用average解决。注意:在bagging集成中,各个模型的预测不会彼此依赖。Bagging算法不用我们自己实现,随机森林就是基于Bagging算法的一个典型例子,采用的基分类器是决策树。可以直接调用。Boosting的思想是一种迭代的方法,它每次训练使用的都是同一个训练集。但是每次它会给这些分类错误的样例增加更大的权重,下一次迭代...

2020-04-04 20:21:35 89

原创 二手车价格预测建模和调参部分

1、定义一个reduce_mem_usage()函数通过调整数据类型,帮助我们减少数据在内存中占用的空间(祖传);2、有时序的采用nested交叉验证,无时序的采用K折交叉验证;3、贝叶斯调参方法。...

2020-03-31 18:38:03 147

原创 spring框架

spring框架1、spring的核心是控制反转(IoC)和面向切面(AOP)2、tx代表事务管理3、核心容器(beans core context expression)4个核心+1个依赖(Commons-logins jar)4、maven下载,缺啥jar包就自动下载的5、配置文件:开发中一般在classpath下(src)名称:开发中常用applicationContext.x...

2020-03-30 16:42:08 89

原创 二手车价格预测特征工程部分

1、包装了outliers_proc( )函数,用于清洗异常值。2、构造新特征汽车的使用时间,data[‘creatDate’] - data[‘regDate’],查看这个特征的空数据,有15k个样本的时间是有问题的,我们可以选择删除,也可以选择放着。但是这里不建议删除,因为缺失量过大,占比7.5%,可以先放着,因为如果我们xgboost之类的决策树,其本身就能处理缺失值,所以可以不用管;3...

2020-03-26 15:13:09 165

原创 二手汽车交易价格预测EDA

二手汽车交易价格是一道回归类的赛题EDA部分:新学习到的知识:1、missingno模块用来查看每一个特征的缺失值2、采用describe函数查看每一列的统计量,当出现999,9999,-1时,都是nan的另外一种表达形式,需要留意3、如果每一列的特征空值不多,则可以选择填充;如果空值过多,则可以考虑删掉;如果使用lgb模型,可以直接空缺,让树自己去优化。4、此赛题中seller和of...

2020-03-24 17:42:27 622

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除