饺子馅儿～-CSDN博客

原创机器学习之主成分分析（PCA）

有监督学习（Supervised Learning）定义：从标记的训练数据来推断一个功能的机器学习任务。利用一组已知类别的样本调整分类器的参数，使其达到所要求性能的过程。特点：训练数据既有特征（feature）又有标签（label）。通过训练，让机器可以自己找到特征和标签之间的联系。常见的算法包括朴素贝叶斯、KNN（K-最近邻）、SVM（支持向量机）等。应用场景：当数据集中每个样本都有明确的标签时，适合使用有监督学习。例如，图像分类、垃圾邮件识别等。

2024-06-17 11:33:40 811

原创机器学习之支持向量机（SVM)

鸢尾花数据集是一个经典数据集，在统计学习和机器学习领域都经常被用作示例。数据集内包含 3 类共 150 条记录，每类各 50 个数据，每条记录都有 4 项特征：花萼长度、花萼宽度、花瓣长度、花瓣宽度，可以通过这4个特征预测鸢尾花卉属于（iris-setosa, iris-versicolour, iris-virginica）三种中的哪一品种。#数据内容运行时报错解决方法：降低numpy版本后成功运行。支持向量机（SVM）是一种强大的监督学习算法，用于分类和回归分析。

2024-06-11 14:56:47 818 1

原创机器学习之逻辑回归

逻辑回归是一种用于解决分类问题的统计学习方法。尽管名字中含有"回归"一词，但逻辑回归实际上是一种分类算法，用于预测输入变量与离散输出变量之间的关系。逻辑回归通过将输入特征的加权和与一个逻辑函数（如sigmoid函数）进行组合，从而得出一个介于0和1之间的概率值，表示样本属于某个类别的可能性。当概率大于0.5时，通常将样本归为正类；当概率小于0.5时，则归为负类。逻辑回归常用于二元分类问题，但也可以通过修改模型来处理多类别分类。它被广泛应用于医学、社会科学、金融等领域，在实践中表现出良好的性能和解释性。

2024-05-28 12:33:59 1558

原创机器学习————朴素贝叶斯

朴素贝叶斯（Naive Bayes）是一种简单但强大的机器学习算法，常用于文本分类、垃圾邮件过滤、情感分析等任务。在进行朴素贝叶斯实验后，可以得出以下小结：数据预处理：在使用朴素贝叶斯算法之前，通常需要对数据进行预处理。这可能包括去除停用词、词干提取、向量化文本等步骤，以便算法能够有效地处理文本数据。特征选择：朴素贝叶斯算法假设特征之间相互独立，因此在特征选择时应该考虑特征之间的相关性。一些特征选择方法，如信息增益、卡方检验、互信息等，可以帮助选择最相关的特征。

2024-05-14 13:01:03 751

原创深入理解机器学习：决策树详解及Python实现

具体方法是：从根节点开始，对节点计算所有可能的特征的信息增益，选择信息增益最大的特征作为节点的特征，由该特征的不同取值建立子节点；信息增益比定义为信息增益与训练数据集关于特征的值的熵之比。在分类问题中，表示基于特征对实例进行分类的过程，可以认为是if-then规则的集合，也可以认为是定义在特征空间与类空间上的条件概率分布。这样产生的树往往对训练数据的分类很准确，但对未知的测试数据的分类却没有那么准确，即出现过拟合现象。解决这个问题的办法是考虑决策树的复杂度，对已生成的决策树进行简化，这个过程称为剪枝。

2024-04-30 15:34:26 257 1

原创模型评估与ROC、PR曲线详解实践

通过本次实验，我们掌握了常见的分类模型评估指标及其计算方法，了解了ROC曲线和PR曲线的原理及差异，并学会了如何绘制和分析不同k值下的ROC曲线。而PR曲线则更加关注在正例较少的情况下，模型的精确率和召回率之间的平衡，适用于不平衡数据集。随着树的数量增加，模型的性能有所提升，ROC曲线下的面积也相应增加，表明模型的分类能力随着树的数量增加而改善。在机器学习中，分类是一个见的任务。在本实验中，我们深入探讨了常见的分类模型评估指标、ROC曲线和PR曲线，并通过Python代码实现了相关的功能绘制了相应的图表。

2024-04-16 13:24:11 898

原创 Knn算法python实现

K最近邻（KNN）是一种简单而有效的机器学习算法，用于分类和回归任务。它的工作原理基于数据点之间的距离度量。以下是KNN算法的简要介绍：1. **基本概念**：- KNN是一种基于实例的学习算法，不需要显式地训练模型。它存储训练数据的所有实例，并根据新实例与训练数据中实例的相似度来进行预测。- KNN算法对应两种基本任务：分类和回归。在分类问题中，它预测实例属于哪个类别；在回归问题中，它预测实例的连续数值。2. **工作流程**：- 对于给定的新实例，算法计算它与训练数据中每个实例的距离。

2024-04-02 21:11:56 1806

原创 vscode安装及环境配置

Step 3.接下来就是选择安装路径了，默认是安装在C盘，可以点击浏览选择自己的安装路径，这里我选择在D盘路径：“D:\TOOL\Microsoft VS Code”；因为比较喜欢桌面干净就不勾选桌面快捷方式了，还有也不想用VSCode添加到右键菜单，支持打开目录，也不勾选了；Step1.双击下载好的安装包，可能有些会出现安全警告，到时点击运行即可，这里我没有出现所以就没有展示了；Step 5. 这里要选择自己想要的功能，点击下一步，下面本人勾选功能，仅供参考；2、在这里可以选择自己想要下载的版本。

2024-03-18 21:46:35 393 3

原创 Anaconda安装及环境配置

Anaconda可以管理包，就是能够安装、更新、移除工具包，比如Numpy、Scipy、pandas、Scikit-learn等数据分析中常用的包；也可以管理环境，能够创建、访问、共享、移除环境，用于隔离不同项目所需要的不同版本的工具包，所以，我们可以建立 Python2 和 Python3 两个环境，来分别运行不同版本的 Python 代码。其中，env_name 是环境的名称，package_names 是安装在创建环境中的包名称。Anaconda Prompt：终端，可以使用命令行来管理包和环境。

2024-03-18 21:35:34 2002 2

m0_73231314的博客