626-CSDN博客

原创 dw吃瓜task3

是决策树学习算法对付"过拟合"的主要手段.在决策树学习中，为了尽可能正确分类训练样本，结点划分过程将不断重复，有时会造成决策树分支过多，这时就可能因训练样本学得"太好"了，以致于把训练集自身的一些特点当作所有数据都具有的一般性质而导致过拟合.因此，可通过主动去掉一些分支来降低过拟合的风险.显然，决策树的遍历是一个递归过程，一共有三种情况可能导致递归返回：（1）.当前结点所包含数据均为同一类别，无需再分：（2）.当前属性集为空，或所有样本在所有属性上均取值相同，无法划分；显然，这个决策过程是基于树的结构。

2023-11-23 23:25:43 867

原创 dw吃瓜task2

将需要预测的数据也投影在这条已经得到的线上，根据其相距距离，判断其具体属于哪个类别。图3 LDA二维示意图，“+”，“-”分别代表正例和反例，椭圆表示数据簇的外轮廓，虚线表示投影，红色实心圆和实心三角形分别表示两类样本投影后的中心点.如图2，单位阶跃函数不连续，因此需要找到在一定程度上近似单位阶跃函数的“替代函数”，并希望它单调可微。若将y记为样本x作为正例的可能性，则1-y即为x作为反例的可能性，所谓的“几率”则为。都可使均方误差最小化，这时，选取的最优解需要依靠算法的归纳偏好决定。

2023-11-20 22:17:13 24

原创 dt 吃瓜task1

显然，D’中一部分数据是重复的，而另一部分不会出现，利用简单的数学知识可知，样本在m次采集过程中不被采集到的可能是。对于以上两问题，解决“欠拟合”较为简单，如在决策树学习中扩展分支、在神经网络学习中增加训练轮数等，而过拟合则很麻烦.在后面的学习中，我们将看到，过拟合是机器学习面临的关键障碍，各类学习算法都必然带有一些针对过拟合的措施。其特殊情况为“留一法”，即对于包含m个样本的集合D，令k=m，其分得的测试集仅含一个样本，优点：得到的模型往往与期望的模型很相似，因此，留一法的评估结果往往被认为比较准确。

2023-11-15 00:57:33 63 1

第六次作业.zip

2023-03-23

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人