- 博客(6)
- 收藏
- 关注
原创 【超详细】SVM 支持向量机实战:线性 / 非线性分类与决策边界可视化
本文介绍了支持向量机(SVM)的原理与实战应用。首先阐述了SVM的核心概念,包括最大化分类间隔、支持向量的作用以及线性/非线性分类的实现方法。接着详细展示了基于scikit-learn的SVM实战流程:从数据预处理、模型训练到评估指标计算,特别针对线性可分(ex6data1)和非线性环形分布数据(ex6data2)分别采用线性核和RBF核进行建模。通过决策边界可视化函数直观展示了分类效果,并分析了关键参数(C值、gamma值)的影响。结果表明SVM在两类数据集上均能取得优异表现,最后还提出了参数调优、多分类
2025-12-24 16:28:38
1122
原创 朴素贝叶斯分类器详解:从原理到代码实现
本文详细介绍了朴素贝叶斯分类器的原理与实现。该模型基于贝叶斯定理和特征独立性假设,通过计算后验概率进行分类。文章以西瓜数据集为例,展示了从数据准备、概率计算到分类决策的完整流程,包括离散特征的条件概率计算和连续特征的高斯概率密度估计。针对工程实践中的常见问题,提出了拉普拉斯平滑(解决零概率)和对数转换(防止数值溢出)两种优化策略,并给出了完整的Python实现代码。该分类器在文本分类等场景中表现优异,具有实现简单、计算高效的特点。
2025-12-03 01:02:54
674
原创 ID3 与 C4.5 决策树算法实战:从代码实现到可视化对比
本文对比分析了ID3和C4.5决策树算法在贷款决策问题中的应用。实验基于16条训练数据和7条测试数据,采用不同的特征选择标准:ID3使用信息增益,而C4.5引入信息增益率解决多值特征偏好问题。Matplotlib可视化显示两种算法的决策树结构差异,其中C4.5取得了100%的测试准确率,优于ID3的85.7%。分析表明,C4.5通过特征熵惩罚机制使特征选择更均衡,具有更好的泛化能力,适用于包含连续特征或不均衡特征的场景。
2025-11-12 20:09:45
816
原创 (接上文)datingTestSet.txt数据集
40920 8.326976 0.953952 largeDoses14488 7.153469 1.673904 smallDoses26052 1.441871 0.805124 didntLike75136 13.147394 0.428964 didntLike38344 1.669788 0.134296 didntLike72993 10.141740 1.032955 didn
2025-10-29 22:34:19
281
原创 Python 从零手撕 KNN:约会网站配对预测实战(附完整代码与数据集)
自定义新用户特征(飞行里程、冰淇淋消耗、游戏时间)# 对新样本归一化(使用训练集的最小值和范围)# 预测兴趣程度# 结果映射result_map = {1:'无兴趣', 2:'低兴趣', 3:'高兴趣'}print(f"新用户兴趣预测:{result_map[pred_result]}")数据预处理的重要性:特征归一化是 KNN 算法的关键步骤,直接影响距离计算的公平性和模型性能;算法原理的直观性:KNN 无需复杂的训练过程,通过 “距离计算 + 邻居投票” 即可实现分类,易于理解和实现;
2025-10-29 22:33:12
1054
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅