自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(8)
  • 收藏
  • 关注

原创 基于python实现pca(主成分分析)原理和实现

PCA(Principal Component Analysis)是一种常用的数据降维技术,通过线性变换将原始数据映射到新的低维空间中,保留原始数据中的大部分信息。PCA 的基本思想是,寻找一个正交基使得在这个基上的方差最大,从而达到降维的目的。在平时的数学建模中,需要用到降维操作:比如在图像处理中,如果要识别人脸,需要将每张图像表示为一个向量,每个元素代表图像中某个像素点的灰度值。由于每张图像的像素数量很大,可能成百上千万甚至更多,这会导致计算和存储成本非常高。

2023-12-31 16:26:13 1285 1

原创 基于python实现SVM(支持向量机)

SVM是一种经典的监督学习算法,其基本思想可以简单概括为以下几点:1.寻找最优的超平面:SVM 的目标是在特征空间中找到一个最优的超平面,以能够将不同类别的样本正确地分开。超平面是一个 d-1 维的子空间,其中 d 是特征空间的维度。2.最大化间隔:SVM 在寻找超平面时,会尽可能地将不同类别的样本分开,并且使得支持向量(离超平面最近的样本点)到超平面的距离最大化。这个距离被称为间隔(margin),因此 SVM 也被称为最大间隔分类器。

2023-12-18 21:46:09 1715 1

原创 基于logistic回归原理和实现

添加偏置项到特征矩阵中# 定义sigmoid函数。

2023-12-02 16:46:46 297

原创 利用朴素贝叶斯算法处理垃圾邮箱识别

'!','!',if total:首先,定义了英文停用词集合stop_word_set,其中包括了常见的标点符号和空白字符等。同时,还定义了中文停用词集合stop_word_set_cn,它通过读取文件"dataset\SogouC\stopwords_cn.txt"来获取中文停用词列表。接下来是delete_stop_word(word, type='cn')函数,用于删除停用词和特殊字符。

2023-11-19 18:29:16 494 1

原创 决策树,一种强大的机器学习算法

决策树是一种基于树状结构的机器学习算法,用于解决分类和回归问题。它是一种直观且易于理解的模型,常被用于数据挖掘和预测分析。决策树通过将数据集逐步划分为不同的子集来进行决策。树的每个内部节点代表一个特征或属性,叶节点代表一个决策结果或类别。从根节点开始,根据样本特征的取值,沿着树的分支向下遍历,最终到达叶节点,得到预测结果。为了更加好理解我们列举一个实例,假设我们有一个数据集,包含了一些汽车的属性(如品牌、车型、价格、颜色等),我们想要使用决策树算法来预测这些汽车是否适合买家。

2023-11-06 17:53:25 130

原创 机器学习基于Python实现PR曲线和ROC曲线

PR曲线和ROC曲线是评估分类模型性能的重要工具。它们可以帮助我们在不同阈值下比较模型的性能,并选择最佳的阈值进行预测。这篇博客将介绍如何使用Python实现PR曲线和ROC曲线,并提供相应的示例代码。在介绍PR曲线之前,我们需要先了解几个概念。这里为了更加形象深刻地理解我们采用识别汉堡🍔的样例。为了判断一张图片是不是汉堡我们可以把照片扔进去一个分类器进行识别如下:其中根据上面数据得到的预测和实际结果的对比我们做出了以下表格:上面表格中的四个数组成的矩阵也就是我们需要理解的的混淆矩阵。

2023-10-21 19:15:43 1351

原创 Knn算法的实现

当涉及到分类问题时,K最近邻算法是一种简单而常用的机器学习算法。KNN算法属于监督学习算法,可以用于对未知样本分类或标记。KNN算法的基本思想是基于近邻样本的距离进行分类。它不需要事先对数据进行训练,而是在预测时根据待分类样本与训练集中已有样本的距离来确定其类别。KNN算法的步骤如下:准备数据集:收集带有标签的训练样本数据集,其中每个样本都有对应的特征和标签。选择k值:确定要考虑的邻居数量k,通常通过交叉验证来选择最佳的k值。

2023-10-09 21:37:29 323 1

原创 机器学习的环境搭建

1.vscode的安装,由于下载的网站:https://code.visualstudio.com/是外国的服务器,所以可以直接去某宝直接买个安装包直接安装会比较快。2.安装anaconda和环境构建检查:官网链接:Free Download | Anaconda。然后输入y继续下载,最后用conda+activate+环境名激活(如图)检查环境搭建:在cmd输入conda activate 即可结果如下。首先输入conda create -n 环境名 +python版本。如果进去了就是配好了。

2023-09-25 20:06:21 72 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除