![](https://img-blog.csdnimg.cn/direct/157bd224bc6942c4a42488d7863a533a.png?x-oss-process=image/resize,m_fixed,h_224,w_224)
机器学习
文章平均质量分 94
机器学习相关代码
Momo_159357
少年要横冲直撞,无所畏惧!
展开
-
机器学习——聚类问题
D中不属于任何簇的样本被认为是噪声 (noise)或异常(anomaly)样本。那么,如何从数据集D中找出满足以上性质的聚类簇呢?DBSCAN算法先任选数据集中的一个核心对象为“种子”,再由此出发确定相应的聚类簇。1.找核心对象根据 (ϵ,MinPts) 对 n 个对象进行搜索,寻找所有的核心对象,构成核心对象集合。2.成簇根据上述的核心对象寻找 D 中所有密度相连的样本,构成簇,若上述核心对象已被访问,则剔除出去。3.重复重复上述过程,直至核心对象集合为空。其它问题。原创 2024-02-16 10:34:54 · 1061 阅读 · 0 评论 -
机器学习——集成学习
📕参考:ysu老师课件+西瓜书 +期末复习笔记。原创 2024-02-03 22:26:45 · 1658 阅读 · 0 评论 -
决策树的相关知识点
【决策树】:决策树是一种描述对样本数据进行分类的树形结构模型,由节点和有向边组成。其中每个内部节点表示一个属性上的判断,每个分支代表一个判断结果的输出,最后每个叶节点代表一种分类结果。理解:它是一个树状结构,其中每个节点代表一个特征属性的判断,每个分支代表这个判断的结果,而每个叶节点(叶子)代表一种类别或回归值。包含整个数据集,并通过某个特征属性进行判断。从根节点出发的每个路径,代表在某个特征属性上的判断结果。在决策路径上的非叶节点,表示对某个特征属性的判断。原创 2024-02-02 17:49:33 · 2780 阅读 · 0 评论 -
SVM支持向量机
SVM在高维空间中表现出色,特别适用于处理具有许多特征的数据集,如文本分类或图像识别。SVM通过最大化间隔的方式,有助于提高模型对新样本的泛化能力,降低过拟合的风险。即使在样本量相对较小的情况下,SVM也能表现良好,这是因为它主要关注支持向量。使用核函数可以处理非线性问题,将数据映射到更高维的空间中,使其在高维空间中变得线性可分。SVM对于一些噪声和异常值的影响相对较小,支持向量主要受到那些距离超平面最近的样本的影响。原创 2024-02-01 19:35:26 · 1046 阅读 · 0 评论 -
朴素贝叶斯分类算法
1.分类算法:分类算法的内容是根据给定特征,求出它所属类别。2.先验概率:就是根据以往的数据分析所得到的概率。后验概率:是得到信息之后重新加以修正得到的概率。3.贝叶斯决策:贝叶斯决策理论中,我们希望选择那个最小化总体期望损失的决策。决策损失的期望值通过对所有可能状态的加权平均来计算,其中权重是先验概率。原创 2024-01-27 16:14:43 · 1114 阅读 · 0 评论 -
机器学习--回归算法
项目实践的一般流程是:准备数据→配置网络→训练网络→模型评估→模型预测配置网络包括:定义网络、定义损失函数、定义优化算法训练网络:1. 网络正向传播计算网络输出和损失函数。2. 根据损失函数进行反向误差传播,将网络误差从输出层依次向前传递, 并更新网络中的参数。3. 重复1~2步骤,直至网络训练误差达到规定的程度或训练轮次达到设定值。原创 2024-01-05 20:19:37 · 1059 阅读 · 0 评论 -
最小二乘法和梯度下降法
1.最小二乘法通过最小化实际观测值与模型预测值之间的残差平方和来确定最佳参数。 核心思想:求解未知参数,使得理论值与观测值之差(即误差,或者说残差)的平方和达到最小。2.梯度下降法梯度下降法是一种优化算法,常用于机器学习和深度学习中,用于最小化一个损失函数。核心思想:是通过迭代调整模型参数,以使损失函数达到最小值。 参数更新:新参数 = 旧参数 - 学习率 × 梯度原创 2024-01-25 23:12:02 · 1509 阅读 · 1 评论 -
机器学习实践
波士顿房屋的数据于1978年开始统计,共506个数据点,涵盖了波士顿不同郊区房屋的14种特征信息。在这里,选取房屋价格(MEDV)、每个房屋的房间数量(RM)两个变量进行回归,其中房屋价格为目标变量,每个房屋的房间数量为特征变量。将数据导入进来,并进行初步分析。原创 2024-01-05 22:56:27 · 989 阅读 · 0 评论 -
机器学习(一)——基础概念
机器学习专门研究计算机怎样模拟或实现人类的学习行为,以获取新知识或技能,重新组织已有的知识结构使之不断改善自己的性能。机器学习是人工智能的一个分支。我们使用计算机设计一个系统,使它能够根据提供的训练数据按照一定的方式来学习;随着训练次数的增加,该系统可以在性能上不断学习和改进,通过参数优化的学习模型,能够用于预测相关问题的输出。原创 2023-01-25 10:07:31 · 1467 阅读 · 0 评论