![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
数据挖掘
文章平均质量分 85
unhurried人生——冕临
这个作者很懒,什么都没留下…
展开
-
岭回归算法
岭回归是一种专用于共线性数据分析的有偏估计回归方法,实质上是一种改良的最小二乘估计法,通过放弃最小二乘法的无偏性,以损失部分信息、降低精度为代价获得回归系数更为符合实际、更可靠的回归方法,对病态数据的拟合要强于最小二乘法。其实就是降低精度来提高泛化性,这种方法较适合用于病态数据的拟合。在用高阶多项式拟合数据时,有可能会拟合出系数特别大的表达式,即每个特征对输出的影响都很大。除了在训练集上的表现,我们希望模型在测试集上同样具有较好的拟合效果(泛化性),此时就希望训练的模型的系数尽可能地小(趋向于0)。原创 2022-09-24 19:57:24 · 9560 阅读 · 0 评论 -
逻辑回归算法
逻辑回归算法是所有机器学习算法中最简单的算法,主要解决二分类问题,用来表示某件事情发生的可能性,逻辑回归算法将任意输入映射到0-1之间,在线性回归中可以得到一个预测值,然后将该值映射到Sigmoid函数中,这样就完成了由值到概率之间的转换,也就是分类问题。简单来说,逻辑回归算法就是拟合一个函数,来预测某一件事情所发生的概率,一件事情所发生的概率自然是在0-1范围内。...原创 2022-08-03 22:53:10 · 352 阅读 · 0 评论 -
线性回归算法
线性回归算法概述线性回归是利用数理统计中回归分析,来确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法,运用十分广泛。线性回归模型是相对简单的回归模型,对一个或多个自变量之间的线性关系进行建模,可用最小二乘法求模型函数。回归分析中,只包括一个自变量和一个因变量,且二者的关系可用一条直线近似表示,这种回归分析称为一元线性回归分析。如果回归分析中包括两个或两个以上的自变量,且因变量和自变量之间是线性关系,则称为多元线性回归分析。......原创 2022-07-25 21:59:32 · 7305 阅读 · 1 评论 -
DBSCAN聚类算法
DBSCAN聚类算法概述DBSCAN聚类算法是一个比较有代表性的基于密度的聚类算法。所谓密度,就是说样本的紧密程度对应其类别,属于同一个类别的样本是紧密相连的。DBSCAN聚类算法可以在噪声的空间数据库中发现任意形状的聚类。DBSCAN聚类算法相关概念在数据集中找一个点,以这个点为圆心,画一个指定半径的圆,在这个圆内的其他点就是与这个点密切的点,如果些点的数量达到一定的数量,也就是达到阈值,就可以认为这个点是核心点。如果一个点在核心点的指定半径圆的这个范围内,那么就说这个点和核心点成为直接密原创 2022-04-13 12:34:42 · 1818 阅读 · 0 评论 -
Kmeans聚类算法
Kmeans聚类算法概述k均值聚类算法是一种迭代求解的聚类分析算法,其步骤是,预将数据分为K组,则随机选取K个对象作为初始的聚类中心,然后计算每个对象与各个种子聚类中心之间的距离,把每个对象分配给距离它最近的聚类中心。聚类中心以及分配给它们的对象就代表一个聚类。每分配一个样本,聚类的聚类中心会根据聚类中现有的对象被重新计算。这个过程将不断重复直到满足某个终止条件。终止条件可以是没有(或最小数目)对象被重新分配给不同的聚类,没有(或最小数目)聚类中心再发生变化,误差平方和局部最小。Kmeans聚类算法是一原创 2022-04-11 21:30:02 · 1532 阅读 · 2 评论 -
BP神经网络
BP神经网络概述BP神经网络即误差反馈神经网络算法。无需事先确定输入输出之间映射关系的数学方程,仅通过自身的训练,学习某种规则,在给定输入值时得到最接近期望输出值的结果。它的基本思想是梯度下降法,利用梯度搜索技术,以期使网络的实际输出值和期望输出值的误差均方差为最小。包括信号的正向传播和误差的反向传播两个过程,即计算机误差输出时按从输入到输出的方向进行,从而调整权重和阈值时按从输出到输入的方向进行。原创 2022-04-09 21:12:32 · 4078 阅读 · 0 评论 -
SVM算法
SVM算法概述SVM又称为支持向量机,是一种二分类的模型。是一种监督学习模型。支持向量机可以分为线性核非线性两大类。其主要思想为找到空间中的一个更够将所有数据样本划开的超平面,并且使得本本集中所有数据到这个超平面的距离最短。举个例子,在一个二维的平面上有放满了红豆和绿豆,左边放着红豆,右边放着绿豆,而中间就是分界线,我们想要把找到一条线,这条线能很好的把红豆和绿豆分开来,中间的分界线很明显就是。但是,能做到把红豆和绿豆分开来的线可能不止一条,如果这条中间的分界线旋转一定的角度,在平面范围内,也许也可原创 2022-04-07 10:46:48 · 2424 阅读 · 0 评论 -
朴素贝叶斯算法
朴素贝叶斯算法概述朴素贝叶斯法是基于贝叶斯定理与特征条件独立假设的分类方法 ,是应用最为广泛的分类算法之一。发源于古典数学理论,有着坚实的数学基础,以及稳定的分类效率。同时,NBC模型所需估计的参数很少,对缺失数据不太敏感,算法也比较简单。有哪个属性变量对于决策结果来说占有着较大的比重,也没有哪个属性变量对于决策结果占有着较小的比重。朴素贝叶斯公式原创 2022-04-06 09:43:20 · 2540 阅读 · 0 评论 -
决策树算法
决策树算法概述决策树是一种十分常用的分类方法。是一种监督学习。决策树是一种树形结构,其中每个内部节点表示一个属性上的测试,每个分支代表一个测试输出,每个叶节点代表一种类别。决策树的来源朴素,其实就是大量的if-else语句,最终根据这些if-else语句得到结果。决策树是一种递归的逻辑结构,其每一个节点都可以作为一棵树,所以我们只需要做到每个节点最优,就可以保证整个决策树最优。对于构建一颗决策树,就是选择最优分裂特征属性,即从当前数据的特征中选择一个最优的特征属性作为当前节点的划分标准,进行划分,从而原创 2022-04-05 12:09:56 · 2459 阅读 · 0 评论 -
KNN算法
KNN算法概述KNN算法分类是数据挖掘算法中最简单的方法之一。是有监督学习的算法。所谓K最近邻,就是K个最近的邻居的意思,说的是每个样本都可以用它最接近的K个邻近值来代表。近邻算法就是将数据集合中每一个记录进行分类的方法。举个简单的例子,近朱者赤近墨者黑,就是你的朋友是怎样的人,你就是怎样的人。再举个例子,一条街道上,一边是高楼大厦,别墅洋房,住着有钱人,一边是茅草盖的房子,住着穷人,这时候有一个新来的人,他住到的高楼大厦那一边,那么我们就会认为他是一个有钱人,因为住的是有钱人那一边。原创 2022-04-04 22:35:47 · 1702 阅读 · 0 评论