abyss-A-CSDN博客

原创组队学习——贝叶斯分类器

高斯混合模型是由多个高斯分布组成的概率模型，每个高斯分布称为一个分量，每个分量有其自己的均值和方差。

2024-07-23 00:53:12 884

间隔与支持向量在机器学习领域中，支持向量机（SVM）是一种常用的监督学习算法，用于分类和回归分析。支持向量是指在特征空间中起决定作用的训练样本，而间隔则是指支持向量到分隔超平面的距离。在SVM中，间隔被最大化，以确保分类边界的鲁棒性和泛化能力。支持向量机通过，以实现对数据的有效分类。间隔的大小直接影响着分类器的性能，较大的间隔通常意味着更好的泛化能力和对未知数据的更好适应性。因此，间隔与支持向量在支持向量机中起着关键作用，帮助算法找到最优的分类边界，并在实际应用中取得良好的性能表现。

2024-07-20 23:31:52 747

原创组队学习——线性回归模型

线性回归就是学习一个线性模型从而尽可能预测出接近真实的值。例如一个线性模型F(x)=WXi+B,线性回归试图学习线性模型，我们的目的是使得预测值F(x)与真实值y之间的误差最小，可以用均方误差指标来作为线性回归最优解的评价指标，当均方误差最小时该线性回归效果达到最好。基于均方误差最小化来求解的方法被称为“最小二乘法”。线性回归中，最小二乘法尝试找出一条直线使得每个数据点到这条直线的欧氏距离之和最小。

2024-07-20 21:47:01 223

原创组队学习——聚类分析

聚类就是将数据集中的样本划分成多个子集，每个子集之间是不相交的，每个子集也称为“簇”。每个簇可能代表着一些潜在的含义，这些含义通常由使用者自己定义。如有一个关于洪水的数据集，要将这份洪水数据集划分成三类：高风险洪水、中风险洪水、低风险洪水。这就需要对该数据集进行聚类，将数据集聚类成三类，也就是将数据集分成三个“簇”，根据实际情况将这三簇分为高、中、低风险。总而言之针对不同的问题应该选用不同聚类方法，在选择使用哪种聚类方法时应该考虑几个方面：数据集的大小、数据的维度、问题的类型等方面。

2024-07-17 13:32:47 1017

原创组队学习——模型评估与选择（评价指标理论）

精度（Accuracy）又可以被称作为正确率或准确率等，有很多种说法，它被定义为正确分类的样本数占总样本数的比例。过拟合意为过度拟合，当模型的学习能力太好时，模型不但学习了训练集中的普遍规律也学习了训练集中的特殊性，这就导致训练误差非常小甚至为0，但是模型的泛化性能会减小，也就是说模型在测试集或预测数据上的预测效果会减弱，这就是过拟合。欠拟合就是拟合效果差，模型未学完训练集中的所有普遍规律，只学习了一部分普遍规律，这也会导致模型的泛化性能差。

2024-07-14 23:53:30 464

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

m0_73957503的博客

原创组队学习——贝叶斯分类器

原创组队学习——支持向量机

原创组队学习——线性回归模型

原创组队学习——聚类分析

原创组队学习——模型评估与选择（评价指标理论）

空空如也

空空如也

原创 组队学习——贝叶斯分类器

原创 组队学习——支持向量机

原创 组队学习——线性回归模型

原创 组队学习——聚类分析

原创 组队学习——模型评估与选择（评价指标理论）

空空如也

空空如也

原创组队学习——贝叶斯分类器

原创组队学习——支持向量机

原创组队学习——线性回归模型

原创组队学习——聚类分析

原创组队学习——模型评估与选择（评价指标理论）