自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(9)
  • 收藏
  • 关注

原创 机器学习之主成分分析(PCA)

有监督学习(Supervised Learning)定义:从标记的训练数据来推断一个功能的机器学习任务。利用一组已知类别的样本调整分类器的参数,使其达到所要求性能的过程。特点:训练数据既有特征(feature)又有标签(label)。通过训练,让机器可以自己找到特征和标签之间的联系。常见的算法包括朴素贝叶斯、KNN(K-最近邻)、SVM(支持向量机)等。应用场景:当数据集中每个样本都有明确的标签时,适合使用有监督学习。例如,图像分类、垃圾邮件识别等。

2024-06-17 11:33:40 564

原创 机器学习之支持向量机(SVM)

鸢尾花数据集是一个经典数据集,在统计学习和机器学习领域都经常被用作示例。数据集内包含 3 类共 150 条记录,每类各 50 个数据,每条记录都有 4 项特征:花萼长度、花萼宽度、花瓣长度、花瓣宽度,可以通过这4个特征预测鸢尾花卉属于(iris-setosa, iris-versicolour, iris-virginica)三种中的哪一品种。#数据内容运行时报错解决方法:降低numpy版本后成功运行。支持向量机(SVM)是一种强大的监督学习算法,用于分类和回归分析。

2024-06-11 14:56:47 785 1

原创 机器学习之逻辑回归

逻辑回归是一种用于解决分类问题的统计学习方法。尽管名字中含有"回归"一词,但逻辑回归实际上是一种分类算法,用于预测输入变量与离散输出变量之间的关系。逻辑回归通过将输入特征的加权和与一个逻辑函数(如sigmoid函数)进行组合,从而得出一个介于0和1之间的概率值,表示样本属于某个类别的可能性。当概率大于0.5时,通常将样本归为正类;当概率小于0.5时,则归为负类。逻辑回归常用于二元分类问题,但也可以通过修改模型来处理多类别分类。它被广泛应用于医学、社会科学、金融等领域,在实践中表现出良好的性能和解释性。

2024-05-28 12:33:59 970

原创 机器学习————朴素贝叶斯

朴素贝叶斯(Naive Bayes)是一种简单但强大的机器学习算法,常用于文本分类、垃圾邮件过滤、情感分析等任务。在进行朴素贝叶斯实验后,可以得出以下小结:数据预处理:在使用朴素贝叶斯算法之前,通常需要对数据进行预处理。这可能包括去除停用词、词干提取、向量化文本等步骤,以便算法能够有效地处理文本数据。特征选择:朴素贝叶斯算法假设特征之间相互独立,因此在特征选择时应该考虑特征之间的相关性。一些特征选择方法,如信息增益、卡方检验、互信息等,可以帮助选择最相关的特征。

2024-05-14 13:01:03 733

原创 深入理解机器学习:决策树详解及Python实现

具体方法是:从根节点开始,对节点计算所有可能的特征的信息增益,选择信息增益最大的特征作为节点的特征,由该特征的不同取值建立子节点;信息增益比定义为信息增益与训练数据集关于特征的值的熵之比。在分类问题中,表示基于特征对实例进行分类的过程,可以认为是if-then规则的集合,也可以认为是定义在特征空间与类空间上的条件概率分布。这样产生的树往往对训练数据的分类很准确,但对未知的测试数据的分类却没有那么准确,即出现过拟合现象。解决这个问题的办法是考虑决策树的复杂度,对已生成的决策树进行简化,这个过程称为剪枝。

2024-04-30 15:34:26 245 1

原创 模型评估与ROC、PR曲线详解实践

通过本次实验,我们掌握了常见的分类模型评估指标及其计算方法,了解了ROC曲线和PR曲线的原理及差异,并学会了如何绘制和分析不同k值下的ROC曲线。而PR曲线则更加关注在正例较少的情况下,模型的精确率和召回率之间的平衡,适用于不平衡数据集。随着树的数量增加,模型的性能有所提升,ROC曲线下的面积也相应增加,表明模型的分类能力随着树的数量增加而改善。在机器学习中,分类是一个见的任务。在本实验中,我们深入探讨了常见的分类模型评估指标、ROC曲线和PR曲线,并通过Python代码实现了相关的功能绘制了相应的图表。

2024-04-16 13:24:11 864

原创 Knn算法python实现

K最近邻(KNN)是一种简单而有效的机器学习算法,用于分类和回归任务。它的工作原理基于数据点之间的距离度量。以下是KNN算法的简要介绍:1. **基本概念**:- KNN是一种基于实例的学习算法,不需要显式地训练模型。它存储训练数据的所有实例,并根据新实例与训练数据中实例的相似度来进行预测。- KNN算法对应两种基本任务:分类和回归。在分类问题中,它预测实例属于哪个类别;在回归问题中,它预测实例的连续数值。2. **工作流程**:- 对于给定的新实例,算法计算它与训练数据中每个实例的距离。

2024-04-02 21:11:56 928

原创 vscode安装及环境配置

Step 3.接下来就是选择安装路径了,默认是安装在C盘,可以点击浏览选择自己的安装路径,这里我选择在D盘路径:“D:\TOOL\Microsoft VS Code”;因为比较喜欢桌面干净就不勾选桌面快捷方式了,还有也不想用VSCode添加到右键菜单,支持打开目录,也不勾选了;Step1.双击下载好的安装包,可能有些会出现安全警告,到时点击运行即可,这里我没有出现所以就没有展示了;Step 5. 这里要选择自己想要的功能,点击下一步,下面本人勾选功能,仅供参考;2、在这里可以选择自己想要下载的版本。

2024-03-18 21:46:35 366 3

原创 Anaconda安装及环境配置

Anaconda可以管理包,就是能够安装、更新、移除工具包,比如Numpy、Scipy、pandas、Scikit-learn等数据分析中常用的包;也可以管理环境,能够创建、访问、共享、移除环境,用于隔离不同项目所需要的不同版本的工具包,所以,我们可以建立 Python2 和 Python3 两个环境,来分别运行不同版本的 Python 代码。其中,env_name 是环境的名称,package_names 是安装在创建环境中的包名称。Anaconda Prompt:终端,可以使用命令行来管理包和环境。

2024-03-18 21:35:34 1123 2

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除