机器学习
文章平均质量分 92
由浅至深,详细讲解机器学习的内容,感谢大家的关注!!!
小言从不摸鱼
欲买桂花同载酒,且惜时,望同游...
展开
-
【机器学习】揭开激活函数的神秘面纱
激活函数(Activation Function)是神经网络中非常关键的组成部分,主要用于在神经网络的节点(或称神经元)上引入非线性因素。这是因为神经网络的基本计算单元是线性加权和,而单纯的线性组合无法模拟现实世界中复杂的非线性关系。通过引入激活函数,神经网络能够学习并模拟各种复杂的映射关系。🐻 激活函数的主要作用包括:引入非线性:如前所述,通过激活函数可以为神经网络提供非线性建模能力,使得神经网络能够学习并解决复杂的问题。控制信息的传递。原创 2024-09-10 00:11:27 · 1024 阅读 · 78 评论 -
【机器学习】Boosting 和 AdaBoost
AdaBoost自适应提升学习算法和Boosting考虑的点一样(观察下图)(1)不同的训练集--->调整样本权重(2)“关注”--->增加错分样本权重(3)“器重”--->好的分类器权重大(4) 样本权重间接影响分类器权重AdaBoost算法提高那些被前一轮基分类器错误分类样本的权值,而降低那些被正确分类样本的权值。从而使得那些没有得到正确分类的样本,由于权值的加大而受到后一轮基分类器的更大关注。AdaBoost采用加权多数表决的方法。分类误差率较小的弱分类器的权值大,在表决中起较大作用。原创 2024-09-08 20:07:26 · 1673 阅读 · 52 评论 -
【机器学习】Bagging和随机森林
Bagging基本流程:通过上述自助采样,采出T个含m个训练样本的采样集,然后基于每个采样集训练出一个基学习器,在将这些基学习器进行组合。在对预测输出进行结合的时候,Bagging通常对分类任务使用简单投票法,对回归任务进行简单的平均法。但是如果投票个数一致,则最简单的做法是随机选择一个类别,当然也可以进一步考察学习器投票的置信度来确定最终的分类。基本分类器可以是决策树,逻辑回归等基分类器。对于稳定性不好的分类器很实用,通过多数投票,减小了泛化误差,而对于稳定的分类器,集成效果并不明显。1.4。原创 2024-09-02 14:54:43 · 1701 阅读 · 139 评论 -
【机器学习】迅速了解什么是集成学习
传统机器学习算法 (例如:决策树,逻辑回归等) 的目标都是寻找一个最优分类器尽可能的将训练数据分开。集成学习 (Ensemble Learning) 算法的基本思想就是将多个分类器组合,从而实现一个预测效果更好的集成分类器。集成算法可以说从一方面验证了中国的一句老话:三个臭皮匠,赛过诸葛亮集成学习通过建立几个模型来解决单一预测问题。它的工作原理是 生成多个分类器/模型,各自独立地学习和作出预测。这些预测最后结合成组合预测,因此优于任何一个单分类的做出预测。原创 2024-09-02 14:20:21 · 1189 阅读 · 34 评论 -
【机器学习】类别不平衡数据的处理
在现实环境中,采集的数据(建模样本)往往是比例失衡的。比如:一个用于模型训练的数据集中,A 类样本占 95%,B 类样本占 5%。类别的不平衡会影响到模型的训练,所以,我们需要对这种情况进行处理。处理的主要方法如下:过采样:增加少数类别样本的数量,例如:减少 A 样本数量,达到 AB 两类别比例平衡。欠采样:减少多数类别样本的数量,例如:增加 B 类样本数量,达到 AB 两类别比例平衡。原创 2024-08-31 20:03:30 · 1117 阅读 · 18 评论 -
【机器学习】朴素贝叶斯原理------迅速了解常见概率的计算
了解常见概率的计算,了解贝叶斯公式,了解朴素贝叶斯中朴素的含义,了解拉普拉斯平滑系数的作用。原创 2024-08-29 15:59:52 · 1025 阅读 · 20 评论 -
【机器学习】决策树------迅速了解其基本思想,Sklearn的决策树API及构建决策树的步骤!!!
决策树思想的来源非常朴素,试想每个人的大脑都有类似于if-else这样的逻辑判断,这其中的if表示的是条件,if之后的then就是一种选择或决策。我们收集了如表1-1的部分用户购买数据,建立了一张统一的调查表,统计几个月的销售数据。有的同学可能在大学学习过一门课程叫《数据结构》,里面有一个重要的结构就是“树”,和现实生活中的树一样,树的主要由四部分。组成,今天的决策树也是一种树结构,大家学习的时候可以想象现实生活中的树来来理解。答:这样会更精确的分析用户的特征信息,给出销售人员更准确的数据信息。原创 2024-08-26 20:15:38 · 2053 阅读 · 85 评论 -
【机器学习】逻辑回归原理(极大似然估计,逻辑函数Sigmod函数模型详解!!!)
逻辑回归(Logistic Regression)是机器学习中的一种分类模型,逻辑回归是一种分类算法,虽然名字中带有回归。由于算法的简单和高效,在实际中应用非常广泛。原创 2024-08-22 08:15:06 · 1325 阅读 · 39 评论 -
【机器学习】逻辑回归介绍(逻辑回归应用场景,原理,损失及优化详解!!!)
逻辑回归(Logistic Regression)是机器学习中的 一种分类模型 ,逻辑回归是一种分类算法,虽然名字中带有回归。由于算法的简单和高效,在实际中应用非常广泛原创 2024-08-21 10:36:15 · 1098 阅读 · 43 评论 -
激活函数与神经网络------带你迅速了解sigmoid,tanh,ReLU等激活函数!!!
人工神经网络( Artificial Neural Network, 简写为ANN)也简称为神经网络(NN),是一种模仿生物神经网络结构和功能的 计算模型。人脑可以看做是一个生物神经网络,由众多的神经元连接而成。各个神经元传递复杂的电信号,树突接收到输入信号,然后对信号进行处理,通过轴突输出信号。下图是生物神经元示意图:当电信号通过树突进入到细胞核时,会逐渐聚集电荷。达到一定的电位后,细胞就会被激活,通过轴突发出电信号。原创 2024-08-20 21:00:08 · 556 阅读 · 10 评论 -
【机器学习】正则化,欠拟合与过拟合(详细代码与图片演示!助你迅速拿下!!!)
过拟合:一个假设在训练数据上能够获得比其他假设更好的拟合, 但是在测试数据集上却不能很好地拟合数据(体现在准确率下降),此时认为这个假设出现了过拟合的现象。(模型过于复杂。欠拟合:一个假设在训练数据上不能获得更好的拟合,并且在测试数据集上也不能很好地拟合数据,此时认为这个假设出现了欠拟合的现象。(模型过于简单过拟合和欠拟合的区别欠拟合在训练集和测试集上的误差都较大过拟合在训练集上误差较小,而测试集上误差较大在解决回归过拟合中,我们选择正则化。原创 2024-08-20 08:12:33 · 1556 阅读 · 29 评论 -
机器学习入门:梯度下降算法(下)
了解全梯度下降,随机梯度下降,小批量梯度下降,随机平均梯度下降的原理。原创 2024-08-19 17:59:53 · 834 阅读 · 11 评论 -
机器学习入门:梯度下降算法(上)
梯度下降法的基本思想可以类比为一个下山的过程。假设这样一个场景:一个人被困在山上,需要从山上下来(i.e. 找到山的最低点,也就是山谷)。但此时山上的浓雾很大,导致可视度很低。因此,下山的路径就无法确定,他必须利用自己周围的信息去找到下山的路径。这个时候,他就可以利用梯度下降算法来帮助自己下山。具体来说就是,以他当前的所处的位置为基准,寻找这个位置最陡峭的地方,然后朝着山的高度下降的地方走,(同理,如果我们的目标是上山,也就是爬到山顶,那么此时应该是朝着最陡峭的方向往上走)。原创 2024-08-19 11:35:36 · 797 阅读 · 14 评论 -
机器学习入门(七):线性回归原理,损失函数和正规方程
线性回归(Linear regression)是利用回归方程(函数)对一个或多个自变量(特征值)和因变量(目标值)之间关系进行建模的一种分析方式。特点:只有一个自变量的情况称为单变量回归,多于一个自变量情况的叫做多元回归。原创 2024-08-18 10:32:43 · 1472 阅读 · 35 评论 -
机器学习入门(六):分类模型评估方法
掌握分类模型评估方法对于数据科学家和机器学习工程师至关重要。它不仅帮助验证模型的有效性,还能指导模型优化方向,确保模型在实际应用中表现优异。通过精确率、召回率等指标,可以全面评估模型性能,识别误分类的类别,从而针对性地改进。学习目标掌握数据集划分中留出法、交叉验证法、留一法 API 的使用了解数据集划分中自助法的采样规则掌握分类问题评估方法sklearn封装了计算准确率的相关API:sklearn.metrics包中的accuracy_score方法: 传入预测结果和测试集的标签, 返回预测准去率。原创 2024-08-13 12:03:44 · 1162 阅读 · 1 评论 -
机器学习入门(五):KNN概述 | K 近邻算法 API,K值选择问题
本小节使用 scikit-learn 的 KNN API 来完成对鸢尾花数据集的预测.API介绍。原创 2024-08-13 11:32:36 · 941 阅读 · 0 评论 -
机器学习入门(四):距离度量方法 归一化和标准化
机器学习算法中,经常需要,比如KNN,K-means,推荐算法中的协同过滤等等,常用的套路是,距离近的样本相似程度高,距离远的相似程度低。所以度量距离是很多算法中的关键步骤。KNN算法中要求数据的所有特征都用数值表示。若在数据特征中存在非数值类型,必须采用手段将其进行量化为数值。比如样本特征中包含有颜色(红、绿、蓝)一项,颜色之间没有距离可言,可通过将颜色转化为。每个特征都用数值表示,样本之间就可以计算出彼此的距离来接下来介绍几种距离度量方法。原创 2024-08-10 12:26:02 · 644 阅读 · 0 评论 -
机器学习入门(三):K近邻算法原理 | KNN算法原理
K-近邻算法可以用来解决监督学习中的分类问题。算法的思想:通过K个最近的已知分类的样本来判断未知样本的类别。原创 2024-08-09 21:59:42 · 611 阅读 · 5 评论 -
机器学习入门(二):如何构建机器学习模型,机器学习的三要素,欠拟合,过拟合
本篇内容我们的目标为:掌握如何构建机器学习模型掌握构建机器学习三要素理解什么是欠拟合和过拟合理解什么是泛化能力来和小言一起回顾机器学习的前置概念吧!在回顾机器学习三要素之前,我们先简单了解一下处理一个机器学习任务需要有那些步骤或流程。原创 2024-08-09 10:09:49 · 515 阅读 · 0 评论 -
机器学习入门(一):机器学习分类 | 监督学习 强化学习概念
让我们一起静下心来,依据下面的思维导图一起回忆本篇文章为我们带来的知识,希望本篇文章能对您有所帮助,小言期待您的关注!原创 2024-08-08 22:08:20 · 1087 阅读 · 9 评论