自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(8)
  • 收藏
  • 关注

原创 机器学习——主成分分析

在机器学习中,我们通常会面对海量的数据,而这些数据可能包含大量的特征。问题是,有些特征可能是冗余的,或者说它们之间存在一定的相关性。这就引出了降维的概念。降维的目标是通过保留数据中最重要的信息,同时减少特征的数量,提高模型的效果。PCA的目标很简单,就是找到数据中的一组新坐标系,使得数据在这个坐标系中的方差最大。这些新坐标系的方向就是我们所说的主成分。通过将数据投影到这些主成分上,我们可以实现在保留最重要信息的同时,将数据从原来的高维空间降到一个更低维的空间。

2024-01-01 18:52:35 978

原创 机器学习-支持向量机

通过选择具有最大间隔的超平面,可以提高分类器的鲁棒性和泛化能力,减少误分类的可能性。最大间隔分类是SVM的一个重要特性。当数据线性可分时,SVM能够找到一个唯一的最大间隔超平面,完全将不同类别的样本分开。而当数据不是线性可分时,SVM使用核函数将数据映射到高维空间,从而在高维空间中找到一个超平面,实现更好的分类效果。而最优超平面则是在所有可能的超平面中,能够最大化两个不同类别间距离的那个超平面。当然,实际情况中数据往往是非线性的,这时候我们可以通过核函数来将其映射到高维空间中,从而得到更好的分类结果。

2023-12-18 19:45:07 26

原创 探索Logistic回归

Logistic回归是一种广泛用于分类问题的统计学习方法。虽然名字中带有“回归”,但实际上,Logistic回归是一种分类算法,用于预测某个实例属于哪个类别。它的本质是通过一个称为Logistic函数的特殊函数,将线性组合的特征映射到0和1之间的概率范围内。

2023-12-04 17:15:02 33

原创 机器学习-贝叶斯分类

18世纪英国数学家托马斯·贝叶斯(这个研究成果由于简单显得平淡无奇,直至他死后两年才于1763年由他的朋友理查德·普莱斯帮助发表。它的数学原理很容易理解,简单说就是,如果你看到一个人总是做一些好事,则会推断那个人多半会是一个好人。这就是说,与其他统计学方法不同,贝叶斯方法建立在主观判断的基础上,你可以先估计一个值,然后根据客观事实不断修正。1774年,法国数学家皮埃尔-西蒙·拉普拉斯()独立地再次发现了贝叶斯公式。

2023-11-20 17:58:58 46 1

原创 决策树:理论与实践

决策树是一种基于树状结构的监督学习模型,它可以应用于分类和回归问题。决策树的构建类似于人类在做决策时的思维过程:从根节点出发,沿着树的不同分支进行一系列决策,最终到达叶节点,得出最终的决策结果。这个过程使得模型易于理解,能够直观地展示特征对输出的影响。对于一个数据集,假设有 𝐾 个类别,每个类别的概率分别为 𝑝1,𝑝2,...,𝑝𝐾 ,则 Gini系数可以通过以下公式计算:其中,Σ表示对所有类别的概率求和。Gini系数的取值范围在 0 到 1 之间,值越小表示数据集的纯度越高,值越大表示不纯度越高。示例。

2023-11-06 21:35:42 227

原创 机器学习-分类评估

科学家门捷列夫说「没有测量,就没有科学」,在AI场景下我们同样需要定量的数值化指标来指导我们更好地应用模型对数据进行学习和建模。事实上,在机器学习领域,对模型的测量和评估至关重要。选择与问题相匹配的评估方法,能帮助我们快速准确地发现在模型选择和训练过程中出现的问题,进而对模型进行优化和迭代。本文我们系统地讲解一下机器学习模型评估相关知识。

2023-10-23 19:27:13 202

原创 机器学习-近邻KNN算法学习笔记

KNN算法是机器学习的入门算法,是我学到的第一个监督学习算法,用于分类和回归问题。它基于实例的学习方法,其中模型不会显式地学习数据的内部结构,而是存储训练数据,然后使用它们来进行预测。

2023-10-09 17:52:18 174 1

原创 机器学习环境初步搭建(conda和Visual Studio Code安装教程超详细版)

对于很多初学机器学习及深度学习的同学来说,搭配环境永远是一个令人十分头疼的问题。在搭配环境的过程中,往往会遇到许多不可预知的bug,就像是医生很难遇到教科书式的病例。这里我将为大家详细地讲述如何搭配环境,希望能够帮助到大家。一.安装Anaconda:建立Python应用环境便捷获取包且对包能够进行管理,同时对环境可以统一管理的发行版本。Anaconda包含了conda、Python在内的许多包及其依赖项。

2023-09-17 13:08:58 2698 2

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除