![](https://img-blog.csdnimg.cn/20201014180756916.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
数据挖掘
Pairsppppp
这个作者很懒,什么都没留下…
展开
-
Task 5 模型融合
模型融合导入相关包import pandas as pdimport numpy as npimport warningsimport matplotlibimport matplotlib.pyplot as pltimport seaborn as snswarnings.filterwarnings('ignore')%matplotlib inlineimport it...原创 2020-04-04 21:45:44 · 183 阅读 · 0 评论 -
Task 4 建模调参
读取数据导入相关包并读取数据import pandas as pdimport numpy as npimport warningswarnings.filterwarnings('ignore')类型,节省内存def reduce_mem_usage(df): """ iterate through all the columns of a dataframe and mo...原创 2020-04-01 12:01:39 · 151 阅读 · 0 评论 -
Task3 特征工程
特征工程属性‘’’SaleID - 销售样本IDname - 汽车编码regDate - 汽车注册时间model - 车型编码brand - 品牌bodyType - 车身类型fuelType - 燃油类型gearbox - 变速箱power - 汽车功率kilometer - 汽车行驶公里notRepairedDamage - 汽车有尚未修复的损坏regionCode...原创 2020-03-28 19:13:59 · 187 阅读 · 0 评论 -
Task2 EDA-数据探索性分析
载入各种数据科学以及可视化库:数据科学库 pandas、numpy、scipy;可视化库 matplotlib、seabon;其他;载入数据:载入训练集和测试集;简略观察数据(head()+shape);数据总览:通过describe()来熟悉数据的相关统计量通过info()来熟悉数据类型判断数据缺失和异常查看每列的存在nan情况异常值检测了解预测值的分布总体分布概况(...原创 2020-03-24 17:17:08 · 259 阅读 · 0 评论