自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(8)
  • 收藏
  • 关注

原创 机器学习----PCA

PCA是Principal Component Analysis(主成分分析)的缩写。它是一种常用的数据降维技术,可以将高维数据降维到低维空间中,同时保留尽可能多的原始数据的信息。PCA的基本思想是:通过线性变换,将原始数据从高维空间投影到低维空间中,并使投影后的数据方差最大。这样可以把数据中的冗余信息去除,得到更紧凑、更容易处理的表示形式。在具体应用中,PCA常常用于数据压缩、特征提取和可视化等领域。PCA还可以用于去噪、异常检测和聚类等任务。

2023-12-31 15:39:50 1310

原创 机器学习:支持向量机(SVM)

支持向量机(Support Vector Machine,SVM)是一种常用的监督学习算法,用于分类和回归任务。SVM的基本原理是构建一个最优超平面来分割不同类别的数据点。在二分类问题中,SVM试图找到一个能够将两个类别的数据点尽可能分开的超平面。超平面是一个d-1维的线性子空间,其中d是数据的特征维度。SVM的目标是找到具有最大间隔(即离超平面最近的样本点的距离最大)的超平面。SVM的核心思想是将数据映射到高维特征空间中,通过引入核函数可以避免直接计算高维特征空间的复杂性。

2023-12-18 21:21:14 360 1

原创 机器学习:Logistic回归

Logistic回归模型通过一个逻辑函数(通常是Sigmoid函数)将自变量的线性组合映射到(0,1)区间内,这个映射值被解释为属于某类的概率。对于二分类问题,模型预测的是样本属于正类(通常标记为1)的概率。

2023-12-04 21:06:42 75

原创 机器学习:朴素贝叶斯

朴素贝叶斯(Naive Bayes)是一种基于贝叶斯定理的机器学习分类算法。该算法基于特征之间条件独立的假设,这意味着它假定给定类别的特征之间是相互独立的。尽管这个假设在实际问题中并不总是成立,但朴素贝叶斯仍然在许多实际应用中表现良好,并且具有快速、简单、高效的特点。在应用朴素贝叶斯进行分类时,算法会首先从训练数据中学习类别与特征之间的关系,然后根据特征的出现概率来预测新样本属于哪个类别。朴素贝叶斯算法在文本分类、垃圾邮件过滤、情感分析等领域得到广泛应用,尤其在大规模数据集上表现优异。

2023-11-20 16:54:13 87 1

原创 机器学习——决策树

决策树是一种机器学习中常用的预测模型,它模拟了人类决策过程的一种方法。它通过使用树状结构来表示一系列的决策规则,以及在每个决策节点上对输入数据进行分支的方式。在决策树中,每个内部节点代表一个特征或属性,用于对输入数据进行划分。而每个叶子节点代表一个输出结果或者决策。从根节点开始,根据输入数据的特征值逐步向下遍历,直到达到叶子节点,得到最终的决策结果。

2023-11-06 21:48:50 135

原创 机器学习基于Python绘制PR曲线和ROC曲线

PR曲线,即Precision-Recall Curve,中文译做精确度-召回率曲线,是一种常用于评估二元分类问题模型表现的工具。精确度(Precision)和召回率(Recall)是评价二元分类问题模型性能的两个相互关联的指标:精确度(Precision):对于预测结果是正例的样本,实际上也是正例的概率。较高的精确度意味着模型对于预测出的正例有着较高的准确度。召回率(Recall):对于所有实际上是正例的样本,被模型预测为正例的概率。较高的召回率意味着模型能够找出所有正例的绝大部分。

2023-10-23 20:06:06 511

原创 KNN算法对糖尿病数据分类

K近邻算法(K-Nearest Neighbors,简称KNN)是一种用于分类和回归的统计方法。KNN 可以说是最简单的分类算法之一,同时,它也是最常用的分类算法之一。KNN算法是选择与输入样本在特征空间内最近邻的k个训练样本并根据一定的决策规则,给出输出结果。(5) 返回前k个点出现频率最高的类别作为当前点的预测类别。分类任务:输出结果为k个训练样本中占大多数的类。(1)计算已知类别数据集中的点与当前点之间的距离;回归任务:输出结果为k个训练样本值的平均值。(3) 选取与当前点距离最小的k个点;

2023-10-09 20:39:45 388 2

原创 机器学习环境搭建

conda写入系统环境变量。创建Acaconda。

2023-09-25 19:58:40 33

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除