自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(7)
  • 收藏
  • 关注

原创 机器学习 PCA主成分分析

PCA全称Principal Component Analysis,又叫做主成分分析。这是一种多元统计方法,用于从多个变量中提取和识别最重要的信息。PCA的主要目的是通过减少数据的维度来简化数据集,同时尽可能保留数据集中的重要特征。PCA是一种通过找到并使用数据的最大方差方向来简化数据集的统计技术。它通过将数据投影到由数据集的主成分构成的新空间来降低数据的维度,同时保留数据中的重要特征。PCA广泛应用于各种领域,如机器学习、数据挖掘、图像处理等。

2024-01-01 21:08:04 1413 1

原创 机器学习 支持向量机

支持向量机(Support Vector Machine,常简称为SVM)是一种监督式学习的方法,可广泛地应用于统计分类以及回归分析。SVM起源于上个世纪六十年代,是机器学习中用于分类的一种算法。它大致经历了以下四个阶段:线性分类器、线性支持向量机、线性不可分问题改进(引入软间隔,Soft Margin)、非线性支持向量机(核函数方法,kernal method)。

2023-12-18 21:56:39 990 1

原创 机器学习 Logistic回归

Logistic回归是一种统计模型,它通常用于二分类问题。不同于线性回归直接模型输出连续值预测,Logistic回归的目标是估计一个事件发生的概率。模型的输出值被限制在0和1之间,这是通过逻辑函数(Logistic function),也被称为Sigmoid函数实现的。多重线性回归模型要求因变量是连续型的正态分布变量,且自变量与因变量呈线性关系。当因变量是分类变量,且自变量与因变量不呈线性关系时,就不能确足多重线性回归模型的适用条件。此时,处理该类资料常用Logistic回归模型。

2023-12-04 21:56:43 367

原创 机器学习 朴素贝叶斯

朴素贝叶斯是一种基于贝叶斯定理的分类算法。它的"朴素"之处在于假设特征之间是相互独立的,即每个特征对于分类的贡献是独立的。朴素贝叶斯算法的主要思想是通过已知的训练样本集,根据特征之间的条件概率来估计待分类样本属于某个类别的概率。朴素贝叶斯算法简单、高效、易于实现和理解,对小规模的数据集表现良好,并且对缺失数据不敏感。相对的,朴素贝叶斯算法过于简单的假设可能会导致模型的性能下降。朴素贝叶斯的工作流程大致可以分为以下四点:1.准备训练样本集,包括已知类别的样本和它们的特征。

2023-11-20 18:21:19 55 1

原创 机器学习 决策树

决策树是一种基于树状图形模型的分类与回归方法。它通过对输入数据的特征进行逐步划分,从而构建一个树形的决策过程。决策树的每个内部节点代表一个特征属性上的判断,每个分支代表一个判断结果,每个叶节点代表一个类别标签或回归值。决策树的优点包括易于理解和解释、能够处理多类别问题,处理缺失数据。但它也有一些限制,比如对输入数据的噪音敏感,容易产生过拟合。决策树是一种常用的机器学习算法,它通过构建一棵树状结构来进行分类和回归任务。决策树的特点包括易于理解、可解释性强、能够处理多类别问题、能够处理连续和离散特征等。

2023-11-06 22:01:03 131

原创 机器学习 模型评估

ROC曲线和PR曲线都是机器学习中常用来评估分类模型性能的工具,它们都针对二分类问题。ROC曲线以真阳率为纵轴,假阳率为横轴,展示了在不同分类阈值下,模型的真阳率和假阳率之间的权衡关系。AUC表示ROC曲线下的面积,用于比较不同模型的性能。ROC曲线适用于处理数据不平衡的情况,但在正样本数量较少时,可能会给出不准确的结果。PR曲线以召回率为纵轴,精确率为横轴。PR曲线更适用于处理数据不平衡的情况,因为它不受真阴率的影响。

2023-10-23 21:31:17 175

原创 探索K近邻算法及其分类器实现

在机器学习领域,有许多经典的算法可以用于分类问题。而K近邻(KNN)算法是其中一种简单而有效的方法。本文将深入探讨KNN算法的原理和实现,并介绍基于KNN算法的分类器的实际应用。K近邻算法是一种简单而有效的分类算法,它通过测量样本之间的距离来对新样本进行分类。基于KNN算法的分类器在实际应用中具有广泛的应用,可以用于图像分类、文本分类、推荐系统等领域。通过学习和实践,我们可以更好地理解KNN算法的原理和实现,并将其应用于实际问题中。

2023-10-09 22:06:03 114 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除