![](https://img-blog.csdnimg.cn/20201014180756780.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
Kaggle
run_session
这个作者很懒,什么都没留下…
展开
-
数据挖掘——模型融合
数据挖掘——模型融合在模型调参结束后,我我们就可以进行模型融合了这是最后也是一个相当重要的环节,方式大概有有以下几种模型融合是比赛后期一个重要的环节,大体来说有如下的类型方式。简单加权融合:回归(分类概率):算术平均融合(Arithmetic mean),几何平均融合(Geometric mean);分类:投票(Voting)综合:排序融合(Rank averaging),lo...原创 2020-04-04 20:21:03 · 195 阅读 · 0 评论 -
数据挖掘——建模调参
常用模型:线性回归,模型决策树模型 ,GBDT模型,XGBoost模型 ,LightGBM模型简单的线性回归,可以用sklearnfrom sklearn.linear_model import LinearRegressionmodel = LinearRegression(normalize=True)model = model.fit(train_X, train_y)当我...原创 2020-04-01 21:11:57 · 216 阅读 · 0 评论 -
数据挖掘——特征工程
文章目录特征工程3.3.1 删除异常值3.3.2 特征构造批量处理时间数据1. 归一化2. 标准化3.3.3 特征筛选特征工程在EDA中我们更多的操作是针对数据本身与分析而特征工程是针对数据的进一步处理来最终选择出我们模型中需要的特征3.3.1 删除异常值# 这里我包装了一个异常值处理的代码,可以随便调用。def outliers_proc(data, col_name, scale=...原创 2020-03-27 19:53:49 · 221 阅读 · 0 评论 -
数据挖掘——EDA(数据探索性分析)
数据挖掘——EDA(数据探索性分析)文章目录数据挖掘——EDA(数据探索性分析)载入数据与缺失值的处理missingno了解数据的分布特征分为类别特征和数字特征,并对类别特征查看unique分布数字特征分析相关性分析查看几个特征得 偏度和峰值每个数字特征得分布可视化数字特征相互之间的关系可视化类别特征分析盒图类别特征的小提琴图可视化类别特征的柱形图可视化类别特征的每个类别频数可视化(count_...原创 2020-03-24 19:49:42 · 1227 阅读 · 0 评论