自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(8)
  • 收藏
  • 关注

原创 机器学习——主成分分析PCA(Principal Component Analysis)

PCA(Principal Component Analysis,主成分分析)是一种无监督学习的降维方法。它基于一个简单的前提:一个高维数据集可能包含许多冗余或相关的特征,而这些特征可能并不都包含有价值的信息。PCA的目标是通过线性变换找到数据的主要成分,即数据的最大方差方向,并将数据投影到这些主要成分上,从而在保持数据的主要特性的同时降低数据的维度。通过本次实验,我们验证了PCA在人脸识别特征降维中的有效性。

2024-06-24 15:37:11 915

原创 机器学习——支持向量机 (Support Vector Machine)

SVM的定义如下:支持向量机(Support Vector Machine, SVM)是一类按监督学习(supervised learning)方式对数据进行二元分类的广义线性分类器(generalized linear classifier),其决策边界是对学习样本求解的最大边距超平面(maximum-margin hyperplane)。下面举一个二维数据的例子,在以下数据点中,对于颜色不同的点,我们可以找一条线将二者分开,以实现分类的目的。

2024-06-11 06:48:34 693

原创 机器学习——逻辑回归(Logistic Regression)

这里,np.ones((X_train.shape[0], 1)) 创建了一个形状为 (n_samples, 1) 的数组,其中 n_samples 是 X_train 的样本数量,所有元素的值都是1。在逻辑回归中,这个函数的主要目的是将线性模型的输出转换为一个介于0和1之间的概率值,这样我们就可以用这个概率值来判断某个样本属于正类(例如,标签为1)的。在逻辑回归中,当我们已经有了线性回归模型的基础后,为了将模型的输出转换为概率值(即预测某个事件发生的可能性),我们引入了sigmoid函数。

2024-05-28 18:02:08 673

原创 机器学习——朴素贝叶斯(Naive Bayes)

PA∣BPB∣A⋅PAPBPA∣BPBPB∣A⋅PA​PA∣B\ P(A|B)PA∣B表示在事件B\ BB发生的条件下,事件A\ AA发生的概率;PB∣A\ P(B|A)PB∣A表示在事件A\ AA发生的条件下,事件B\ BB发生的概率;PA\ P(A)PA和PB\ P(B)PB分别表示事件A\ AA和事件B\ BB单独发生的概率。

2024-05-13 11:28:26 2147

原创 机器学习——决策树(Decision Tree)

本文详细介绍了决策树的理论基础,包括最优属性选择的三种方法,并通过Python代码展示了如何使用scikit-learn库创建决策树、评估模型性能并进行可视化。在实际应用中,我们可以根据数据的特点和需求选择合适的最优属性选择方法。这次实验也让我对决策树有了更深的理解和看法,重点就是掌握决策树的决策理论以及最优属性的选择方法,实验过程中我也遇到了很多困难,比如对Python不熟悉对scikit-learn库中的函数不熟悉。最后,希望在之后的机器学习之旅我能更上一层楼,期待下一次机器学习算法实验。

2024-04-29 12:14:03 812

原创 机器学习——分类模型评估、ROC曲线、PR曲线

ROC曲线(受试者工作特征曲线)和PR曲线(精确率-召回率曲线)是两种用于评估分类模型性能的重要工具。ROC曲线以真正例率(TPR,即召回率)为纵轴,假正例率(FPR)为横轴,通过不同阈值下的TPR和FPR绘制而成。PR曲线则以召回率为横轴,精确率为纵轴,同样通过不同阈值下的召回率和精确率绘制。导入数据后,就需要选择分类器来进行训练,这里我选择了以下几个分类模型。逻辑回归(Logistic Regression):逻辑回归是一种广义的线性回归模型,常用于处理因变量为二分类(0或1)的问题。

2024-04-16 14:09:10 1931

原创 机器学习——KNN算法实战

本文主要介绍博主学习完机器学习的第一个算法——KNN之后的实验和心得,主要包括对鸢尾花数据集进行分析和运用KNN算法划分鸢尾花种类的过程。因为是第一次实验,所以是根据《机器学习实战》这本书上的代码实现过程作为参考,并没有调用sklearn库来直接运用KNN算法模型。这是第一次机器学习的实验,有很多机器学习的概念都不是很清楚,对Python也不是特别熟悉,所以整个过程还是比较困难的,但是算是自己将整个代码敲下来了,也学到了很多,希望下次实验能更加得心应手,能学到更多机器学习的知识,并且增强自己的动手实践能力。

2024-04-01 13:43:03 1848

原创 Anaconda、VS code的安装

通过Anaconda和VS Code,我们就可以进行机器学习的学习了,因为博主自己先前就配置好了Anaconda,所以很多步骤是没有截图的,但是Anaconda安装的基本步骤就是官网下载—>勾选所需选项(最好是自动添加路径)—>命令行检查是否安装完成,而VS Code 的安装就更简单了,直接官网下载然后在扩展商店配置Python环境就可以了,当然,很多环境方面的问题可以在后续的机器学习的学习过程中进行完善。Anaconda提供了丰富的数据科学库和强大的环境管理功能,而VS Code可以用来编辑代码。

2024-03-18 17:36:01 187

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除