![](https://img-blog.csdnimg.cn/20201014180756780.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
机器学习
文章平均质量分 61
煮酒、
这个作者很懒,什么都没留下…
展开
-
决策树剪枝的基本策略有预剪枝和后剪枝,请简述并分析两种剪枝策略
1、决策树是一类常见的机器学习方法,是基于树结构进行决策的。一般的,一棵决策树包含两类结点:内部节点和叶结点,其中内部节点表示表示一个特征或属性,叶结点表示__决策结果____。2、在决策树学习中,一般情况下,属性a 的信息增益越大,则意味着使用属性a 来进行划分获得的__“纯度提升越大”______3、信息增益准则对__可取值数目较多_______的属性有所偏好,增益率准则对__可取值数目较少_____的属性有所偏好。4、在决策树学习中,C4.5决策树算法中采用__二分法___..原创 2021-11-06 17:09:19 · 3267 阅读 · 0 评论 -
在梯度下降过程中,学习率控制着算法每一轮迭代中的更新步长,如果学习率设置的太大容易振荡,设置太小则
1、在梯度下降过程中,学习率控制着算法每一轮迭代中的更新步长,如果学习率设置的太大容易振荡,设置太小则 收敛速度太慢 。2、均方误差有非常好的几何意义,它对应了常用的欧氏距离。基于均方误差最小化来进行模型求解的方法称为_最小二乘法。3、如果使用数据集的全部特征,学习模型在训练集上达到100%的准确率,但在测试集上仅能达到70%左右,这说明存在 过拟合 问题。4、训练对数几率回归分类模型,如果在模型中引入正则项,正则化参数会对模型的性能有很大的影响,如果设置的过大则不能缓解过拟合问题,如果设置的过原创 2021-10-20 16:32:03 · 2340 阅读 · 1 评论 -
简述k折交叉验证法
1、以二分类任务为例,假定数据集D包含1000个样本,将其划分为训练集S和测试集T,其中S包含800个样本, T包含200个样本,用S进行训练后,如果模型在T上有50个样本分类错误,那么模型的正确率为75% 。 2、PR(Precision-Recall)曲线的横轴和纵轴分别是查全率 和查准率 。3、ROC曲线的横轴和纵轴分别是 假正例率 和 真正例率 。4、对于二分类问题,可将样本根据...原创 2021-10-18 21:40:42 · 4492 阅读 · 5 评论