![](https://img-blog.csdnimg.cn/20201014180756913.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
机器学习
学统计的程序员
这个作者很懒,什么都没留下…
展开
-
阿里天池竞赛项目——二手车交易价格预测
二、特征工程特征工程主要涉及数据的处理、特征的构造和特征帅选。特征构造我们对照官方给的变量的定义,发现model、 brand、 bodyType、 fuelType等为取几个值的离散变量。当我们采用基于树模型(XGBoost、LightGBM)来解决回归问题时,针对每一棵树,需要做的是确定分裂的变量,以及分裂点。一般采用启发式方法,根据分裂后的收益(误差)是否下降,并选择下降最多的分裂点,来逐步构建一棵树。由于上述的几个变量的值,只是代表类别,并不代表实际的大小,根据值大小的分裂并不能代表实际的原创 2020-10-28 10:41:45 · 14010 阅读 · 4 评论 -
python可视化决策树
直接上代码把:import pandas as pdfrom sklearn.tree import DecisionTreeRegressorfrom sklearn.model_selection import train_test_splitfrom sklearn.metrics import mean_squared_error,r2_score,mean_absolute_error读取数据:df=pd.read_csv('housing_data.csv') #数据是我自己以前爬原创 2020-09-28 22:01:21 · 405 阅读 · 0 评论