自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(9)
  • 收藏
  • 关注

原创 机器学习之主成分分析 PCA

一、引言主成分分析(Principal Component Analysis,PCA)是一种常用的方法,用于。它最早由卡尔·皮尔逊于1901年提出,是一种统计学方法,后来被广泛引入到机器学习领域。主成分分析的背景和意义主要体现在以下几个方面:1.数据降维:在现实世界中,许多数据集具有高维特征,这给数据的存储、可视化和分析带来了挑战。主成分分析可以帮助我们在不丢失太多信息的情况下,将高维数据转换为低维数据,从而简化数据集的复杂度。

2023-12-30 21:13:07 902 1

原创 机器学习之支持向量机

在支持向量回归中,我们的目标是通过构建一个超平面,使得尽可能多的训练样本点落在超平面的边界内,并且超平面与这些点之间的距离最小。通过调节C的值,我们可以控制模型对于错误分类的容忍程度。在支持向量机中,最大化决策边界的边缘是指找到一个超平面,使得它与离它最近的两个不同类别的样本点之间的距离最大化。它的目标是在保持较好的分类能力的同时,尽量减少错误分类样本的数量。其中,||w||是权重向量w的L2范数,C是一个调节参数,用于平衡模型复杂度和错误预测的权重,ξ_i和ξ_i*是松弛变量,用于容忍预测误差。

2023-12-18 21:38:56 964 1

原创 机器学习之Logistic回归

对于逻辑斯蒂回归,梯度的计算公式为:(\frac{\partial \ell(\theta)}{\partial \theta_j} = \sum_{i=1}^{m} (h_{\theta}(x_i) - y_i) x_{ij}),其中 (x_{ij}) 表示第 (i) 个样本的第 (j) 个特征值。在逻辑斯蒂回归中,假设样本的标签 (y_i) 是根据一个二元分布生成的,其中标签为1的概率为 (h_{\theta}(x_i)),标签为0的概率为 (1 - h_{\theta}(x_i))。

2023-12-04 21:18:06 107

原创 机器学习之朴素贝叶斯算法

具体来说,假设有一个参数化模型,其中包含一个未知的参数 θ,我们的目标是通过已有的样本来估计 θ 的取值。同时,选择合适的算法和处理方法也是非常重要的,对于不同的问题,需要选择不同的算法来解决,这需要我们具备一定的理论知识和实践经验。具体地,设特征向量为 X = (x1, x2, ..., xn),类别集合为 C = {c1, c2, ..., ck},我们的目标是计算在给定特征向量 X 的条件下,属于每个类别的概率 P(ci|X),然后选择具有最大后验概率的类别作为样本的分类结果。

2023-11-20 17:10:36 411 1

原创 机器学习之决策树

在划分数据集之前之后信息发生的变化成为信息增益,知道如何计算信息增益,我们就可以计算每个特征值划分数据集获得的信息增益,获得信息增益最高的特征就是最好的选择。4.预测或分类:当新的数据样本进入决策树时,通过遍历树的路径,根据每个节点的划分规则将样本分配到对应的叶子节点。对于分类问题,叶子节点表示具体的类别;5.参数调优:决策树有一些参数可以进行调优,如决策树的最大深度、分裂节点的最小样本数、划分特征的方式等。在决策树中,每个节点的任务是选择一个最佳的特征来进行分割,使得分割后的子集尽可能地纯净。

2023-11-06 22:08:03 76

原创 机器学习之模型评估

ROC 曲线以真正率(True Positive Rate)为纵轴,假正率(False Positive Rate)为横轴绘制,AUC 表示 ROC 曲线下的面积,可以作为评估模型分类性能的指标。仅有良好的数据和算法并不能保证一个好的模型,我们还需要通过模型评估来确定模型的性能和可靠性,并根据评估结果对模型进行进一步的调整和改进。最后,我们需要记住,更复杂的模型并不一定能得到更好的性能,模型的选择应根据问题的实际需要,遵循奥卡姆剃刀原则,即在能解决问题的所有模型中选取最简单的一个。

2023-10-23 21:56:27 258

原创 k-近邻算法

简单来说,k-近邻算法即采用测量不同特征值之间的距离方法来进行分类。工作原理:存在一个样本数据集合,也称作训练样本集,并且样本集中每个数据都存在标签,即我们知道样本集中每一数据与所属分类的对应关系。输入没有标签的新数据后,将新数据的每个特征与样本集中数据对应的特征进行比较,然后算法提取样本集中特征最相似数据(最近邻)的分类标签。一般来说,我们只选择样本数据集中前k个最相似的数据,这就是k-近邻算法中k的出处,通常k是不大于20的整数。最后,选择k个最相似数据中出现次数最多的分类,作为新数据的分类。

2023-10-09 21:45:14 53 1

原创 vs code和pytorch的下载

在pytorch官网中找到适合自己电脑的版本进行下载,我的相关语句为conda install pytorch==1.12.1 torchvision==0.13.1 torchaudio==0.12.1 cudatoolkit=11.3 -c pytorch 但是在cmd以及所配置环境中均下载失败,于是我又换了个语句install pytorch torchvision torchaudio cpuonly -c pytorch 但。3、下载时要先确定好所下载内容须在大环境或是定义好的环境中下载。

2023-09-25 21:53:49 45 1

原创 vscode与pytorch下载

官网中找到适合自己电脑的版本进行下载,我的相关语句为conda install pytorch==1.12.1 torchvision==0.13.1 torchaudio==0.12.1 cudatoolkit=11.3 -c pytorch 但是在cmd以及所配置环境中均下载失败,于是我又换了个语句install pytorch torchvision torchaudio cpuonly -c pytorch 但。3、下载时要先确定好所下载内容须在大环境或是定义好的环境中下载。

2023-09-25 21:43:35 322 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除