决策树
bingbangx
唯一不变的就是变
展开
-
windows系统下Graphviz的安装
graphviz本身是一个软件,需要额外下载,并将其bin加入环境变量之中。1)首先到官网下再这个包并安装。http://www.graphviz.org/2)配置环境变量将Graphviz安装目录下的bin文件夹添加到Path环境变量中系统属性----> 高级----->环境变量将路径添加到Path环境变量中。3)验证使用windows命令界面,输入dot -version,然后按回车,如果显示graphviz的相关版本信息,则安装配置成功。...原创 2020-07-01 17:23:53 · 697 阅读 · 0 评论 -
sklearn中的决策树模块及流程
sklearn 中的决策树一、模块sklearn.treesklearn中的决策树都在“tree”这个模块之下,这个模块共包括五个类:tree.DecisionTreeClassifier 分类树 tree.DecisionTreeRegressor 回归树 tree.export_graphviz 将生成的决策树导出为DOT格式,画图专用 tree.ExtraTreeClassifier 高随机版本的分类树 tree.ExtraTreeRegressor原创 2020-07-01 15:06:38 · 540 阅读 · 0 评论 -
DecisionTreeClassifier重要参数、属性、接口(实现一棵树,随机性参数)
DecisionTreeClassifier重要参数1.criterion要将表格转化成一颗树,决策树需要找出最佳节点和最佳的分枝方法,对分类树来说,衡量这个“最佳”指标“叫做不纯度criterion这个参数正是用来决定不纯度的计算方法。sklearn提供了两种选择:1)输入”entropy“,使用信息熵2)输入”gini“,使用基尼系数决策树的基本流程:直到没有更多的特征可用,或整体的不纯度已经最优,决策树就会停止生长。...原创 2020-07-03 14:55:44 · 3741 阅读 · 0 评论 -
DecisionTreeRegressor重要参数、接口、属性
重要参数:criterion 回归树衡量分枝质量的指标,支持的标准有三种: 1)输入"mse"使用均方误差mean squared error(MSE),父节点和叶子节点之间的均方误差的差额将被用来作为特征选择的标准,这种方法通过使用叶子节点的均值来最小化L2损失 2)输入“friedman_mse”使用费尔德曼均方误差,这种指标使用弗里德曼针对潜在分枝中的问题改进后的均方误差 3)输入"mae"使用绝对平均误差MAE(mean absolute error),这种指标使用叶节点的中值来原创 2020-07-04 19:11:32 · 3478 阅读 · 1 评论 -
交叉验证的应用
利用原本的数据集,记录交叉验证的各参数应用:1、导入需要用到的库from sklearn.datasets import load_bostonfrom sklearn.model_selection import cross_val_scorefrom sklearn.tree import DecisionTreeRegressor2、进行交叉验证boston = load_boston()regressor = DecisionTreeRegressor(random_sta原创 2020-07-04 23:47:00 · 383 阅读 · 0 评论 -
一维回归的图像绘制(随机数)
在绘制一维回归的图像时,这个小例子采用随机数进行一个简单的操作,一共分为五步:导入用到的库;创建一条含有噪声的曲线;实例化训练模型;将测试集导入模型,预测结果;画图观察哪种模型的效果更好。1、导入需要哟个到的库import numpy as npfrom sklearn.tree import DecisionTreeRegressorimport matplotlib.pyplot as plt2、创建一条含有噪声的正弦曲线rng = np.random.RandomState(1原创 2020-07-04 22:44:33 · 494 阅读 · 0 评论