尚思畅-CSDN博客

原创西瓜书（机器学习）第六章支持向量机

对于二分类问题，分类的目标就是找到一个超平面能够将不同类别的样本点分隔开来，使得正例样本点与负例样本点到超平面的距离最大化，这个距离就是超平面到支持向量的距离，称为间隔（margin）。最大间隔支持向量机（Support Vector Machine, SVM）是一种二分类模型，它的基本思想是寻找一个最优的超平面（hyperplane）来将不同类别的样本分开，其中最优指的是使得超平面与最近的样本点（即支持向量）之间的距离最大。L1正则化加入的约束项是模型参数的L1范数，即L1范数越大，模型越稀疏。

2023-04-08 16:45:51 235

原创西瓜书（机器学习）第五章神经网络

神经元模型是神经网络中的基本单元。它是一种数学模型，可以接收输入信号，对其进行加权处理并施加一个激活函数，最终输出一个结果。神经元模型通常由多个输入和一个输出组成，每个输入都有一个权重参数，用于表示该输入对输出的重要程度。输入信号与权重相乘后相加，再通过激活函数进行处理，得到最终的输出结果。神经元模型的数学表达式为：其中，表示神经元的输入，表示每个输入对应的权重，b表示偏置，表示激活函数，y表示神经元的输出。在训练神经网络时，我们需要对权重和偏置进行调整，以使得神经元的输出尽可能接近目标输出。

2023-04-07 17:14:16 241

原创西瓜书（机器学习）第四章决策树

预剪枝是一种在决策树生成过程中，在划分一个节点之前先估计划分该节点是否会导致过拟合的方法，如果划分后的验证集准确率不提高或者下降，则停止划分，将该节点标记为叶子节点。首先将数据集按照该属性排序，然后枚举每个相邻属性对的中间值作为分割点，将数据集分成两部分，计算每一种划分的信息增益或信息增益比，选择信息增益或信息增益比最大的分割点作为最终的分割点。首先将数据集按照该属性排序，然后枚举每个相邻属性对的中间值作为分割点，将数据集分成两部分，计算每个划分的基尼系数，选择基尼系数最小的分割点作为最终的分割点。

2023-04-06 19:55:01 298

原创西瓜书（机器学习）第三章线性模型

在二分类问题中，对数几率回归可以将样本分类为正类或负类，它的预测结果是一个概率值，当概率大于0.5时，将样本归为正类，否则将其归为负类。LWLR的基本思想是：对于给定的测试样本，利用训练集中与其相近的样本来进行预测，同时对于距离较远的样本赋予较小的权重，距离较近的样本赋予较大的权重。这样做的好处是，在预测时，只需要关注与测试样本最相似的那些训练样本，从而避免了不必要的计算。LDA 的假设是，不同类别的样本都是由高斯分布生成的，且不同类别的高斯分布具有相同的协方差矩阵，即各个类别的高斯分布是同性别的。

2023-04-04 21:10:02 118

m0_65930263的博客

原创西瓜书（机器学习）第六章支持向量机

原创西瓜书（机器学习）第五章神经网络

原创西瓜书（机器学习）第四章决策树

原创西瓜书（机器学习）第三章线性模型

原创西瓜书（机器学习）第二章模型评估与选择（第二部分）

原创西瓜书（机器学习）第二章模型评估与选择（第一部分）

原创西瓜书（机器学习）第一章

原创基数排序（radixsort）迭代和递归

原创冒泡排序（bubblesort）

原创快速排序（quick sort）

原创成功安装sklearn，仍提示No module named ‘sklearn‘的解决方案

原创选择排序（selectionsort）和插入排序（insertionsort）

原创顺序搜索和二分搜索

原创基于Python的堆优化单源最短路径

空空如也

空空如也