自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(10)
  • 收藏
  • 关注

原创 机器学习——PCA

给定n个样本(每个样本维度为p维)定义为样本在第一主成分上的投影:我们的目标是找到a1使z1的方差最大。目标:PCA 的主要目标是找到一个新的坐标系,使得在新的坐标系下,数据的方差最大化。目标是找到a1 , 使z1的方差最大。)这样做的目的是减少数据的维度,并且保留尽可能多的信息。数据中心化:将每个特征的均值都减去,使得数据的均值为零。计算协方差矩阵:计算去中心化后数据的协方差矩阵。特征值分解:对协方差矩阵进行特征值分解,得到特征值和特征向量。选择主成分:根据。

2023-12-31 15:04:22 818

原创 机器学习——支持向量机

支持向量机(support vector machines,SVM)是一种分类模型,其基本定义为特征空间上的间隔最大化的线性分类器,本质上是一个求解凸二次规划的问题。支持向量机是求解特征空间上的最大间隔(软间隔、硬间隔),是一个线性分类器,为了支持非线性的分类,引入了核技巧,用于将输入从输入空间映射到特征空间。相比较而言,核变换方法算是比支持向量机用得更广泛的一种机器学习方法。

2023-12-17 18:08:32 980 1

原创 机器学习——Logistic回归:分类问题

逻辑回归通过将自变量的线性组合映射到一个概率值,然后根据这个概率值进行分类。它使用一个称为逻辑函数(Logistic Function)或Sigmoid函数的特殊函数来实现这种映射。输入特征和输出:在回归任务中,我们有一组输入特征(通常表示为X)和对应的输出(通常表示为y)。输入特征可以是一个或多个特征变量,例如房屋面积、气温等。输出是一个连续的数值,如房价、销售额等。回归模型:回归模型通过学习输入特征和输出之间的关系,建立一个数学函数来进行预测。不同的回归算法使用不同的模型形式和参数。

2023-11-29 20:24:17 971

原创 机器学习——朴素贝叶斯算法

代码中遇到的错误:1.在加载数据集的时候,文件路径格式不正确:在spamTest函数中,文件路径的格式不正确,应该是和而不是和。这种小细节应该注意,不再犯这种低级错误2.textParse函数中的变量名错误,查看错误后,在textParse函数中,变量应该为小写,即。Python是区分大小写的,因此这个错误可能导致函数无法正常工作。数据预处理:收集垃圾邮件和非垃圾邮件的数据集。每封邮件需要被转换为特征向量建立词汇表:遍历所有训练样本的文本内容,提取其中的单词,并构建一个词汇表。

2023-11-17 20:29:03 155 1

原创 机器学习——决策树

本实验,我直接利用在sklearn库中的criterion:特征选择准则,默认值为"gini"。可选值有"gini"和"entropy"。用于选择最优的特征进行划分,可以通过计算基尼系数或信息熵来评估特征的重要性。splitter:特征划分策略,默认值为"best"。可选值有"best"和"random"。用于指定在每个节点上选择特征的策略,"best"表示选择最优的特征,"random"表示随机选择特征。max_depth:决策树的最大深度,默认值为None。用于限制决策树的最大深度,防止模型过拟合。

2023-11-05 17:31:16 241 1

原创 机器学习——PR,ROC曲线

总的来说,这次实验让我对于绘制PR,ROC曲线的流程有了系统的认识,也了解了绘制PR,ROC曲线得意义:绘制PR曲线和ROC曲线可以提供全面的分类模型性能评估,并帮助选择适当的分类阈值,从而提高模型的预测能力和泛化性能。如图,有一条y=x的斜线,如果平衡点在y=x斜线上,说明分类器预测为正例和真正为正例的比例一致,此时分类器具有较好的性能。那么在进行预测时,predict_proba()方法的输出将是一个形状为(100, 2)的二维数组,其中第一列表示属于负例类别的概率,第二列表示属于正例类别的概率,

2023-10-20 11:41:56 913 1

原创 机器学习——K近邻(KNN)算法

K近邻算法(KNN)是一种用于分类和回归的统计方法。k-近邻算法采用测量不同特征值之间的距离方法进行分类。同时要注意,KNN 算法是有监督学习中的分类算法。在运行天气和旅行适合度代码时,出现以下错误查看资料后发现是切割时发生问题,一开始用如下这句代码进行切割,但是由于我的travel.txt文件中列与列之间是用空格分开的(如图是一部分数据),所以导致报错,后将如下代码修改成line.split( )后,即可成功运行。#修改前#修改后。

2023-10-05 13:09:01 1015

原创 机器学习—— 一、环境配置

1.访问https://repo.anaconda.com/archive/ ,根据当前你的机器操作系统配置。1.在官网code.visualstudio.com里下载安装,我是windows所以选择第一个。注:base:默认环境,该环境包含了大部分常用的Python包以及必要的库。6.安装过程中可以把帮我们安装到path的选项勾选上,也可以后期手动配置。3.注意:安装过程中同样有一个选项是添加到path,勾选上。2. 双击进行安装,同意协议,再选择安装路径。之后next,再finish就安装成功了。

2023-09-19 23:21:50 142 1

原创 关于向量化

importnumpyasnpnp.dot(w.T,x)+b:w^Tx+b这里定义v是个列向量np.log(v): 逐个元素计算lognp.abs(v): 计算绝对值np.maximum(v,0): 计算所有元素中的最大值(求出v中所有元素和0之间相比的最大值)v**2 : v中每个元素的平方1/v : 每个元素求倒数可以通过运行时长,直观的看出向量化后运行时间更短,运行更高效。向量化实现在logistic回归上,可同时处理整个训练集,实现梯度下降法的一步迭代 不需要使用显...

2022-01-30 19:10:45 1706

原创 2021-11-13

网络构建:1.全连接层2.卷积层:(1.)卷积核深度(通道数)等于输入图片的通道数卷积核通道数=输入通道数(2.)输出通道数=卷积核个数(每层卷积核的个数在设计网络时会给出)3.池化层:提取特征,一般在卷积层后,起简化作用。4.激活函数5.BN操作(批标准化):防止学习过程中梯度消失(当输出值较大或较小时,sigmoid函数就会进入饱和区域,导致其导数几乎为0)...

2021-11-13 10:24:05 1279

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除