自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(8)
  • 收藏
  • 关注

原创 机器学习——PCA主成分分析

主成分分析(Principal Component Analysis,简称PCA)是一种常用的数据降维技术,用于发现数据中的主要特征。PCA的基本思想是将高维数据转换为低维数据,同时最大程度地保留原始数据的信息。它通过线性变换将原始数据投影到一个新的坐标系上,使得在新的坐标系下数据的方差最大。这些新的坐标轴被称为主成分,每个主成分都是原始数据的线性组合。PCA的应用包括降维、数据可视化、特征提取等。它可以帮助我们理解数据中的主要变化模式,并且在一定程度上减少数据的复杂性和存储空间。

2024-01-02 01:34:43 875 1

原创 机器学习——支持向量机(SVM)

SVM是一种二类分类模型(用于分类和回归分析的监督学习算法),其基本模型定义为特征空间上的间隔最大的线性分类器,即的学习策略便是间隔最大化,最终可转化为一个凸二次规划问题的求解。

2023-12-18 21:30:00 901

原创 Logistic回归以及python实现

是机器学习中一类常用的模型,用于建立输入特征与输出变量之间的线性关系。回归是线性模型的一种应用,用于预测连续数值型的输出变量。在线性回归中,我们假设输入特征与输出变量之间存在线性关系。具体来说,对于给定的输入特征 x1, x2, ..., xn,线性回归模型的形式可以表示为:当n为1的时候就是最简单的一元一次方程模型:其中,y是预测的输出变量,x1, x2, ..., xn是输入特征,w1, w2, ..., wn是对应的权重,b是偏置项。

2023-12-04 23:46:05 1002

原创 朴素贝叶斯分类

朴素贝叶斯分类(Naive Bayes classification)是一种基于贝叶斯定理和特征条件独立假设的分类方法。它是一种简单而高效的分类算法,在文本分类、垃圾邮件过滤、情感分析等领域得到广泛应用。具体来说,朴素贝叶斯分类器中的“朴素”指的是特征之间独立的假设,即在给定类别的情况下,每个特征与其他特征之间是相互独立的。这个假设虽然在实际应用中并不总是成立,但在很多情况下,朴素贝叶斯分类仍然能够取得较好的分类效果,并且具有较强的鲁棒性。

2023-11-27 20:45:14 1105 1

原创 机器学习——决策树

决策树是一种基于树状结构的机器学习模型,用于分类和回归问题。它通过对数据集进行逐步分割,生成一棵树来进行决策和预测。树上的每个节点代表一个特征属性或一个判断条件,每个叶子节点代表一个类别标签或一个数值结果。以下是一个决策树模型实例:一家网店的商品是否会被下架。

2023-11-06 21:30:00 67

原创 ROC曲线以及PR曲线的原理以及python实现

PR曲线是Precision-Recall(精确率-召回率)曲线的简称,用于评估二分类模型在不同阈值下的性能表现。PR曲线的横轴是召回率(Recall),纵轴是精确率(Precision),通过绘制不同阈值下的精确率和召回率之间的关系,可以直观地展示模型在不同阈值下的整体性能。是衡量模型对实际正例样本的识别能力,即模型能够正确预测出多少实际正例。计算公式为:Recall=TP/(FN+TP)​。是衡量模型在预测为正例的样本中真正为正例的比例,即模型预测为正例的样本中有多少是真正的正例。

2023-10-23 21:45:00 160

原创 Anaconda,VS code ,pytorch的安装

方法一:通过官网下载Anaconda点击官网右上角Free Download下载方法二:若官网下载速度慢,可通过清华大学镜像下载。

2023-10-23 14:52:24 50

原创 KNN算法

在函数内部,遍历训练集train_set中的每个数据点,并计算其与输入数据点之间的距离。将计算的结果以字典的形式存储在res列表中,包括训练数据点的分类结果和与输入数据点的距离。在KNN算法中,通过将新的输入样本与训练样本进行相似度度量,来进行分类或回归预测。遍历测试集test_set中的每个数据点,分别计算其真实分类结果和KNN分类结果,并统计分类准确的样本数量。定义了计算欧氏距离的distance函数,用于计算两个数据点之间的距离,并设置K值为5。输出结果中:B为良性(无癌症),M为恶性(有癌症)

2023-10-09 21:45:00 36 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除