自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(8)
  • 收藏
  • 关注

原创 机器学习——PCA

在这个新坐标系里,数据的主要变化方向被凸显出来,我们可以选取其中最重要的几个方向(即“主成分”)来重新表示数据,从而在保留大部分关键信息的同时,实现数据的简化。比如一组三维空间中的点,如果它们大致分布在一个倾斜的平面上,那么PCA就能帮我们找到这个平面,并将数据投影到其上,用两个主成分就能较好地描述数据的整体结构,从而实现从三维到二维的降维,同时尽可能不丢失重要信息。将特征值从大到小排序,根据需要保留的信息量选择前 k 个最大的特征值所对应的特征向量,作为最终的主成分(k 就是我们降维后想要的维度数)。

2026-01-19 16:05:33 348

原创 支持向量机(SVM)

支持向量机(SVM)是一种常用的监督学习分类模型,主要用于处理二分类问题。它的核心思想是:找到一个最佳的决策边界(也称为“超平面”),使得这个边界距离不同类别的样本都尽可能远,从而提升分类的稳定性和泛化能力。从数学角度来看,SVM的训练过程可转化为求解一个凸二次规划问题,确保最终得到的是全局最优解。

2026-01-19 16:01:52 381

原创 Logistic回归

1.logistics回归概述logistic回归属于概率型非线性回归与直线回归的区别:线性回归的因变量y是连续性数值型变量,不能是分类变量。logistic回归是研究二分类、多分类、有序多分类(等级资料)观察结果(因变量)与一些影响因素(自变量)之间的关系。如因变量:食管癌发生,一个二分类变量;

2026-01-19 15:58:46 423

原创 朴素贝叶斯算法

通过对这个好坏瓜分类器系统我了解到了朴素贝叶斯分类器的结构非常直观,易于理解,这使得它在很多领域都有广泛的应用。同时,也需要注意朴素贝叶斯算法对特征独立性的假设,这可能会降低模型的准确性。

2026-01-19 15:51:09 499

原创 机器学习 决策树

运行截图:性能报告:拒绝贷款 1.00 1.00 1.00 3批准贷款 1.00 1.00 1.00 4特征重要性:特征 重要性2 有自己的房子 0.601 有工作 0.400 年龄段 0.003 信贷情况 0.00。

2026-01-19 15:42:51 486

原创 KNN算法性能度量以及roc,pr曲线的绘制

通过绘制ROC和PR曲线进行性能评估,我们能够更全面地理解模型在不同情况下的表现,尤其是针对类别不平衡的场景。print(f"宏观平均AP: {np.mean(list(average_precision.values())):.4f}")game_time = float(input("视频游戏时间占比(0-100):"))ice_cream = float(input("每周冰淇淋消费量(升):"))- 召回率:在实际为正的样本中,被模型正确找出来的比例,反映模型的“查全”能力。

2026-01-19 15:38:31 597

原创 KNN算法

我们很容易发现,当计算样本之间的距离时数字差值最大的属性对计算结果的影响最大,也就是说,每年获取的飞行常客里程数对于计算结果的影响将远远大于上表中其他两个特征-玩视频游戏所耗时间占比和每周消费冰淇淋公斤数的影响。3. **确定K值:选择一个K值**,即在分类或回归时应考虑的邻居数量。7. **优化:**基于性能评估结果,可能需要返回并调整某些参数,如K值、距离度量方法等,以获得更好的性能。2. **选择距离度量方法**:确定用于比较样本之间相似性的度量方法,常见的如欧几里得距离、曼哈顿距离等。

2026-01-19 15:21:11 540

原创 安装Anaconda

一定要点击确定直到环境窗口全部确认关闭,再重复打开一次环境变量查看是否有。打开搜索框,搜索环境变量,双击打开。第二步: 安装anacond。

2026-01-19 15:14:54 63

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除