自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(9)
  • 收藏
  • 关注

原创 主成分分析(PCA)之人脸识别:从理论到实践

主成分分析(Principal Component Analysis, PCA)是一种统计方法,通过正交变换将一组可能存在相关性的变量转换为一组线性不相关的变量,这组新的变量被称为主成分。PCA的主要目标是降低数据维度,同时保留尽可能多的原始信息。PCA作为一种无监督的降维方法,在人脸识别中展现了强大的能力。通过本文的实现,我们了解到:PCA能有效提取人脸的主要特征仅用少量主成分就能较好地重建人脸图像特征脸具有直观的可解释性在保持识别率的同时大幅降低数据维度。

2025-06-10 23:31:27 683

原创 使用支持向量机(SVM)构建垃圾邮件过滤器

在当今数字时代,电子邮件已成为我们日常生活和工作中不可或缺的通信工具。然而,随之而来的是大量垃圾邮件的困扰。本文将分享我如何使用支持向量机(SVM)技术构建一个高效的垃圾邮件过滤器。

2025-06-01 08:00:00 794

原创 逻辑回归原理、实现与实验总结

关键认知突破。

2025-05-19 16:53:23 869

原创 基于朴素贝叶斯的西瓜分类

贝叶斯算法基于18世纪托马斯·贝叶斯提出的条件概率定理,通过先验知识与新数据结合计算后验概率,实现概率动态更新。核心算法包括:朴素贝叶斯(文本分类/垃圾邮件过滤)、贝叶斯网络(变量关系建模)、贝叶斯优化(黑箱函数优化)和贝叶斯滤波(机器人定位)。优势在于融合先验与数据,但存在计算复杂和先验主观性等问题,广泛应用于NLP、医疗、金融等领域,仍是数据科学的重要工具贝叶斯算法的优缺点1、优点贝叶斯算法基于贝叶斯定理,它为概率模型的学习和推理提供了明确的理论框架。

2025-05-05 20:54:51 1974

原创 决策树算法

决策树(Decision Tree)是一种基于树形结构的监督学习算法,主要用于分类和回归任务。其核心思想是通过一系列规则(if-then结构)对数据进行分割,最终形成一棵树来模拟决策过程关键概念:节点:分为根节点(起始特征)、内部节点(中间决策点)和叶节点(最终结果)分裂准则信息增益(ID3算法,适用于分类)信息增益比(C4.5算法,解决ID3对多值特征的偏好)基尼系数(CART算法,分类与回归均适用)均方误差(MSE,CART回归树)停止条件:如节点样本数低于阈值、纯度达到要求或树达到最大深度。

2025-04-21 22:12:23 1182

原创 ROC曲线与PR曲线评估K-近邻算法

1. ROC曲线核心思想:反映模型在不同阈值下真正例率(TPR)与假正例率(FPR)的权衡TPR(召回率) = TP / (TP + FN)FPR(假正率),越低越好TPR(真正率),越高越好关键指标:越接近1,模型区分能力越强;0.5表示随机猜测对类别不平衡不敏感(因FPR和TPR均基于真实类别计算)适用于关注整体分类性能的场景(如医学检测)2. PR曲线核心思想:反映模型在不同阈值下精确率(Precision)与召回率(Recall)的权衡Recall(召回率),越高越好。

2025-04-06 00:17:52 798

原创 K近邻算法——实现海伦约会

K近邻算法(K-Nearest Neighbors,简称KNN)是一种简单且常用的监督学习算法,主要用于分类和回归任务。其核心思想是:给定一个样本,通过计算其与训练集中所有样本的距离,找到距离最近的K个样本,然后根据这些邻居的类别或值来预测该样本的类别或值。

2025-03-24 19:49:54 1935

原创 VSCode下载安装+python拓展

以上就是VSCode下载安装+python拓展的全部内容(收工!可以选择创建快捷方式,直接下一步。在扩展商店中搜索Python安装。以Windows系统为例。可以自行更改安装位置。

2025-03-01 18:11:19 474

原创 Anaconda安装+配置教程

是一个开源的 Python 和 R 语言发行版,主要用于数据科学、机器学习、大规模数据处理和科学计算。它集成了大量常用的数据科学包和工具,简化了环境管理和包安装过程,使得用户可以。

2025-03-01 17:52:32 2300 1

ROC&PR曲线评估K-近邻算法

ROC&PR曲线评估K-近邻算法

2025-04-06

KNN(基于K近邻算法的分类器的实现)源码

KNN(基于K近邻算法的分类器的实现)源码

2025-03-24

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除