- 博客(21)
- 收藏
- 关注
原创 【机器学习】利用PCA对人脸图像进行降维与重建
执行后,程序会展示测试集前5张图像的原始和PCA重建效果。20个主成分已经足够保留图像的主要特征;重建图像虽有细节丢失,但整体轮廓清晰;PCA有效降低了数据维度,方便后续的机器学习任务。
2025-06-04 20:54:28
314
原创 【机器学习】使用 SVM 和 Python 构建垃圾邮件分类器
支持向量机(Support Vector Machine, SVM)是一种强大的监督学习算法,主要用于二分类问题。它的基本思想是:找到一个最优超平面,将不同类别的数据尽可能分隔开,并最大化分类边界的间隔。SVM 工作流程。
2025-05-21 20:57:05
240
原创 【机器学习】深入理解二元Logistic回归:原理、实现与应用
在机器学习的世界中,分类问题是核心挑战之一。二元Logistic回归作为最基础且强大的分类算法之一,广泛应用于医疗诊断、信用评分、市场营销等众多领域。本文将带你全面了解二元Logistic回归的原理、数学背景,并通过Python实现展示其实际应用。线性回归适用于预测连续值,但当面对分类问题时(尤其是二元分类),我们需要一种能够输出概率估计的方法。这就是Logistic回归的由来——它虽然名为"回归",但实际上是一种分类算法。Logistic回归:输出概率值(0,1)其中θ是参数向量,x是特征向量。
2025-05-19 18:44:47
935
原创 树状数组的操作详解 | PTA 题目解析
功能要求:构建一个支持:1.单点修改(update)2.区间前缀和查询(query)的树状数组最后需要:1.输出树状数组本身(以数组形式)2.输出从左到右每个位置的前缀和输入格式:n输出格式:一行输出树状数组中各元素的值(下标从1开始)一行输出前缀和数组(query(1) 到 query(n))树状数组的原理;单点更新和区间查询的实现;以及如何调试和输出调试信息。
2025-05-14 15:11:40
412
原创 数据库实践——查询
通过这次实验,我不仅掌握了SQL查询的基本技能,更对数据库的实际运作方式有了更清晰的认知。希望通过阅读本篇博客你也能有所收获!
2025-05-07 15:27:25
466
原创 最小花费锯木头问题:贪心算法的应用
通过使用贪心算法和优先队列,我们可以高效地解决最小花费锯木头问题。这种方法不仅简单易懂,而且运行效率高,特别适合处理大规模数据。在实际编程中,我们常常会遇到类似的问题,需要我们灵活运用算法知识来解决。希望这篇文章能帮助你更好地理解和应用贪心算法。
2025-05-01 22:06:30
393
原创 C语言习题讲解 | 计算 5 × (1! + 2! + ... + n!)
已知求阶乘的函数如下,利用这个函数,编程计算并输出5*(1!+2!+…+n!)的值。注意函数Fact()返回的类型。提示:最后一行输出sum的格式为 printf(“sum=%u”,sum);//无符号整数输入整数n,n小于13。sum=计算结果。4sum=165。
2025-04-29 23:13:30
279
原创 【题解】1-5 简单计算器(栈模拟计算)
栈的基本使用;对元素弹出顺序的细致把握;异常情况(如除 0)的处理。虽然是简单题,但非常经典且实用,非常适合数据结构学习初期训练。
2025-04-26 15:30:53
425
原创 机器学习——朴素贝叶斯分类器在西瓜数据集中的应用
朴素贝叶斯算法是一种基于贝叶斯定理的分类方法,其基本假设是:特征之间是独立的。这一假设虽然在现实中不一定成立,但由于其简洁性和高效性,依然在许多场合表现良好。朴素贝叶斯方法特别适用于大规模数据集,并且可以通过少量的训练数据就能够进行有效的预测。朴素贝叶斯分类器因其简单、高效而广泛应用于各种分类任务。尽管它假设特征之间相互独立,这一假设并不总是成立,但它在许多实际应用中仍表现出色。通过本例,我们展示了如何利用朴素贝叶斯算法来解决一个实际的分类问题——西瓜是否是好瓜。
2025-04-23 20:28:51
867
原创 探索“非常弹”的球:用代码解密物理问题
通过这个简单的物理问题和代码实现,我们可以看到物理原理在实际问题中的应用。动能、重力和运动之间的关系是解决这类问题的关键。当然,这个问题还有很多可以扩展的地方。例如,我们可以考虑空气阻力的影响,或者研究不同角度下球的运动轨迹。
2025-04-21 15:05:12
361
原创 解决“高空坠球”问题:C语言实现
通过这个“高空坠球”问题,我们学习了如何使用循环结构来模拟物理过程,并通过变量的更新来计算出所需的总距离和反弹高度。C语言的简洁性和高效性在这个问题中得到了很好的体现。
2025-04-19 16:16:37
252
原创 功夫传人:武功传承计算问题的分析与解决
这道题目通过树形结构的遍历和简单的数学计算,考察了对递归和树的理解能力。关键点在于:正确构建师徒关系的数据结构设计合理的遍历算法准确计算每一代的功力变化通过这个问题的解决,可以加深对树形结构遍历和递归算法的理解,为处理更复杂的层次关系问题打下基础。
2025-04-14 11:09:36
525
原创 二分法求多项式单根:原理与Python实现
二分法是求函数根的经典数值方法,特别适合初学者理解和实现。本文提供的Python实现简洁高效,可以直接用于求解多项式在给定区间内的单根问题。理解这个算法不仅有助于解决实际问题,也是学习更复杂数值方法的基础。
2025-04-12 18:56:39
301
原创 机器学习实战:决策树构建与分析——ID3与CART方法
ID3(Iterative Dichotomiser 3)算法是由Ross Quinlan于1986年提出的,它主要用于生成分类决策树。ID3的核心思想是通过信息增益(Information Gain)来选择最优特征进行数据集的划分。信息增益衡量了使用某一特征划分数据集后,数据集的不确定性减少的程度,信息增益越大,表示该特征对分类的帮助越大,因此它被选为决策树的分裂节点。计算数据集的熵(Entropy),衡量数据集的不确定性。对于每一个特征,计算通过该特征划分数据集后的信息增益。
2025-04-10 12:20:38
1065
原创 宴会排座问题 —— 并查集(Union-Find)的应用
随后M行,每行给出一对宾客之间的关系,格式为:宾客1 宾客2 关系,其中关系为1表示是朋友,-1表示是死对头。输出格式: 对每个查询输出一行结果:如果两位宾客之间是朋友,且没有敌对关系,则输出No problem;如果他们之间并不是朋友,但也不敌对,则输出OK;如果他们之间有敌对,然而也有共同的朋友,则输出OK but…这里假设朋友的朋友也是朋友。但敌人的敌人并不一定就是朋友,朋友的敌人也不一定是敌人。只有单纯直接的敌对关系才是绝对不能同席的。朋友关系是可以传递的,也就是说朋友的朋友也是朋友。
2025-04-08 19:46:37
302
原创 趣味游戏:求所有包含连续数的区间中第 2 大数的和(python)
在某个趣味游戏活动中,有 N 名同学站成一排,他们的年龄是从 1 到 N 的一组数字,但这些数字是随机排列的。任务是计算出在这些同学中,所有长度大于等于 2 的区间中,包含连续数字的区间的第 2 大数字的和。
2025-04-05 20:33:38
246
原创 特殊数列求和
观察数列规律:解决这类问题时,首先要仔细观察数列的构成规律利用前项构造后项:很多数列问题都可以利用前一项的结果来构造后一项,这样可以提高效率边界条件处理:输入验证(n>=10时输出错误)是编程中不可忽视的部分。
2025-04-03 13:37:39
220
原创 机器学习实战模型评估——ROC曲线与PR曲线(K-近邻方法)
在信号检测理论中,接收者操作特征曲线,或者叫ROC曲线(英语:Receiver operating characteristic curve),是一种坐标图式的分析工具,用于选择最佳的信号侦测模型、舍弃次佳的模型或者在同一模型中设置最佳阈值。ROC曲线首先是由二战中的电子工程师和雷达工程师发明的,用来侦测战场上的敌军载具(飞机、船舰),也就是信号检测理论。之后很快就被引入了心理学来进行信号的知觉检测。
2025-03-29 15:48:00
897
原创 K-NN算法实例——海伦约会
我们很容易发现,当计算样本之间的距离时数字差值最大的属性对计算结果的影响最大,也就是说,每年获取的飞行常客里程数对于计算结果的影响将远远大于上表中其他两个特征——玩视频游戏所耗时间占比和每周消费冰淇淋公斤数的影响。5.使用算法:首先需要输入样本数据和结构化的输出结果,然后运行k-近邻算法判定输入数据分别属于哪个分类,最后应用对计算出的分类执行后续的处理。该网站现在需要尽可能向海伦推荐她喜欢的人,需要我们设计一个分类器,根据用户的以上三种特征,识别出是否该向海伦推荐。计算该样本与训练集中所有样本的距离。
2025-03-24 13:14:58
846
原创 Anaconda下载安装、环境配置以及创建虚拟环境
点击右下角跳过注册直接进入下载界面(以Windows为例)如图点击下载下载完成后打开安装包进入如下界面:选择你要下载到的磁盘(建议存在C盘外的磁盘中)
2025-03-09 15:27:41
678
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人