- 博客(5)
- 收藏
- 关注
原创 机器学习第3集——随机森林 详解+案例
集成学习(ensemble learning)是时下非常流行的机器学习算法,它本身不是一个单独的机器学习算法,而是通 过在数据上构建多个模型,集成所有模型的建模结果。
2022-10-07 17:01:59 3873
原创 机器学习第2集——回归决策树DecisionTreeRegressor() 附案例
② friedman_mse(费尔德曼均方误差,标使用弗里德曼针对潜在分枝中的问题改进后的均方误差)① mse(均方误差,父节点和叶子节点之间的均方误差的差额将被用来作为特征选择的标准)③ mae(绝对平均误差,使用叶节点的中值来最小化L1损失)4、score:返回的是R²,可以为负,模型很糟糕的时候为负。2、fit:用于导入数据集(训练集)下面简单建立一颗回归树。下面2-8个属性详见。
2022-09-26 10:30:35 4165
原创 机器学习第1集——分类决策树tree.DecisionTreeClassifier()
一个节点在分枝后的每个子节点都必须包含至少min_samples_leaf个训练样本,否则分枝就不会发生。“random",决策树在分枝时会更加随机,树会因为含有更多的不必要信息而更深更大,并因这些不必要信息而降低对训练集的拟合。确定不纯度的计算方法,帮忙找出最佳节点和最佳分枝,不纯度越低,决策树对训练集的拟合越好。,限制信息增益的大小,信息增益小于设定数值的分枝不会发生。,限制分枝时考虑的特征个数,超过限制个数的特征都会被舍弃。,限制树的最大深度,超过设定深度的树枝全部剪掉。①实例化(也就是建立模型。
2022-09-25 15:30:24 3296
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人