- 博客(6)
- 收藏
- 关注
原创 基于PCA的人脸识别系统实现
比如:一开始数据集是N维的,在进行了协方差矩阵的特征值计算后,得到了N个特征值和与这些特征值相对应的特征向量。一个协方差矩阵有着不同的特征值与特征向量,最高特征值的对应的特征向量就是这个数据集的主成分。通常来说,一旦协方差矩阵的特征值和特征向量被计算出来了之后,就是按照特征值的大小从高到低依次排列。特征值的大小确定了主成分的重要性。一个矩阵由一个变换到另一个矩阵,Aα=λα,其中α称为矩阵A的一个特征向量,λ称为矩阵A的一个特征值。特征向量确定了矩阵变换的方向,特征值确定了矩阵变换的比例。
2026-01-21 12:55:33
224
原创 基于朴素贝叶斯算法的分类器实现
P(X)是证据(特征X的出现概率,对所有类别相同,分类时可忽略)(1)“特征独立” 假设通常不成立,可能影响精度;P(X|C)是似然(类别C下特征X的出现概率);好瓜(是):共8个 坏瓜(否):共9个。的分类算法,核心是利用概率推理实现分类,是机器学习中经典的 “生成式模型” 之一。好瓜的后验概率远大于坏瓜,因此测 1 是好瓜。(2)对特征的分布假设(如连续特征的正态分布)依赖较强。其中:P(C)表示先验概率(类别C的出现概率);(2)小样本数据有较好的鲁棒性(结合平滑技术);
2026-01-21 12:45:24
445
原创 SVM支持向量机原理及python实现
核函数的核心作用是避免直接进行高维映射的复杂计算,通过计算低维空间中样本的核函数值,等价于计算高维空间中的内积。SVM的核心目标是在特征空间中找到一个“最优分离超平面”,使得该超平面能将不同类别的数据点正确分离,且两类数据点到超平面的最小距离(即间隔)最大。C=100时,准确率为100%(所有样本分类正确),决策边界更贴近异常负样本,模型对训练数据拟合程度更高,但可能过拟合。C=1时,准确率约为98.04%(50个样本分类正确,1个异常负样本被错误分类),决策边界相对平缓,泛化能力更强。
2026-01-20 14:19:26
950
原创 决策树的预剪枝与后剪枝实现
分支的悲观误差:原分支误差 = 1(1 条样本预测错误),剪枝后该节点误差 = 2(假设合并后 2 条错误),但原分支包含 2 个叶节点,剪枝后仅 1 个,惩罚项调整后剪枝误差更低;:包含 3 层节点(根节点 “有自己的房子”→子节点 “有工作”→叶节点),分支完整,保留了 “有自己的房子 = 0” 时进一步用 “有工作” 分裂的逻辑。1.有自己的房子(信息增益最高≈0.32),作为根节点分裂特征,分为 “有房(6 条,全为是)” 和 “无房(10 条,3 是 7 否)”。)→ 叶节点(是 / 否);
2026-01-20 00:00:19
925
原创 基于ID3算法的决策树构建
首先计算整个数据集的信息熵。从训练集数据中,可以统计:样本类别为“否”的有9个,“是”的有7个,总样本数为16。表示类别为 i 类的数据在数据集中出现的概率,由于概率肯定是 [0,1] 之间的一个数,那么取对数后结果值必然为负数,所以加一个负号来描述。1.ID3 算法通过信息增益有效选择分裂特征,构建的决策树具有良好的可解释性,适用于需要明确决策逻辑的场景(如贷款审批、风险评估等)。:从根节点开始,对数据特征进行测试,根据测试结果将数据划分到不同的子节点,递归地进行这一过程,直到达到叶节点(最终决策)。
2026-01-19 12:58:02
814
原创 约会网站推荐系统中KNN算法的实现与模型评估
分析结果显示,模型的平均预测置信度较高,且正确预测的置信度明显高于错误预测,这说明模型对其正确预测有较高的把握。分析结果显示,模型的平均预测置信度较高,且正确预测的置信度明显高于错误预测,这说明模型对其正确预测有较高的把握。这个KNN约会推荐系统不仅具有学术价值,更有实际应用意义,为个性化推荐系统的开发提供了完整的技术参考。所有类别的AUC值都接近1,说明我们的KNN分类器在各个类别上都有出色的区分能力。我们的目标是构建一个KNN分类器,根据这三个特征预测海伦对新约会对象的喜欢程度。
2026-01-19 11:32:10
590
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅