- 博客(5)
- 收藏
- 关注
原创 机器学习课程第四章学习总结
反之,如果样本集合中的样本类别分布均匀,则信息熵为最大值。CART(Classification and Regression Trees)决策树是一种常用的分类和回归模型,通过递归地构建二叉树来对数据进行分类或回归预测,通过选择能够最大程度降低基尼指数的特征进行分裂,以达到最佳的分类或回归效果。与ID3算法相比,C4.5算法引入了增益率的概念,用增益率代替了信息增益,其综合考虑信息增益和分裂特征的不确定性来选择分裂特征,因此,C4.5算法对于复杂数据集具有较强的鲁棒性,但其有计算复杂度较高的缺点。
2023-12-19 19:13:39 1064
原创 机器学习课程第三章学习总结
在建模过程中,up主,解释了书上定义的符号,讲解了如何定义模型部分、损失函数的推导、拉格朗日乘子法、广义特征值以及广义瑞利商的概念,以帮助我们更好地理解线性判别分析的思路和建模过程,介绍了如何在特征空间中找到投影方向从而实现分类的目的。此外,在二分类线性判别分析中,我们需要理解广义特征值的概念。[8]二次元的Datawhale. 第3章-一元线性回归[EB/OL]. (2021-06-06)[2023-12-13]. https://www.bilibili.com/video/BV1Mh411e7VU?
2023-12-13 12:32:41 133
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人