机器学习原理篇:基础数学理论 Ⅱ

机器学习原理篇:基础数学理论 Ⅱ

一、前言

前面我们总结了有关微积分和线性代数的知识,本期我们继续总结有关概率论、数理统计以及最优化理论的知识。

二、概率论

概率论是研究随机先行数量规律的数学分支。随机现象是相对于决定性现象而言的,在一定条件下必然发生某一结果的现象称为决定性现象。概率论是学习人工智能必备的数学知识。概率论已经替代了逻辑主义的功能,被广泛应用于人工智能算法研究。概率论代表了一种看待世界的方式,其关注的焦点是无处不在的可能性,对随机事件发生的可能性进行规范的数学描述是概率论的公理化过程。因此,机器学习算法中经常使用概率统计工具来解决不确定量或随机量。事件的概率是衡量该事件发生的可能性的度量。虽然在一次随机试验中某个事件的发生时带有偶然性的,但那些可在相同条件下大量重复的随机试验却往往呈现出明显的数量规律。

现阶段人工智能研究需要处理的行业信息、数据、资料等都爆发式增长,这使得概率统计成了机器学习的一个关键内容。概率论中,人们认为数据分布是固定不变的,参数要经过计算才能得知,而贝叶斯观念却认为数据分布具有随机性,参数要进行概率最大化后进行计算。

概率论中存在两个学派,即“频率学派”和“贝叶斯学派”。两种概率学派的核心区别在于对先验分布的认识。频率学派认为,假设是客观存在且不会改变的,即存在固定的先验分布,只是作为观察者的我们无从知晓,因而在计算具体事件的概率时,要先确定概率分布的类型和参数,然后以此为基础进行概率推演。相比之下,贝叶斯学派则认为,固定的先验分布是不存在的,参数本身是随机数。换而言之,假设本身取决于观察结果,是不确定且可以修正的。数据的作用是对假设做出不断的修正,使观察者对概率的主观认识更加接近客观实际。

目前,很多机器学习算法是由概率统计的理论作为基础支撑推导出来的,比如代价函数的最小二乘形式、逻辑回归算法都基于对模型的最大似然估计。

概率论中的高斯函数及中心极限定理被广泛应用于人工智能算法。独立同分布的不同随机变量之和会随着变量数的增加而趋向于高斯分布,因此,很多模型假设都采用了高斯函数进行建模。

三、数理统计

在人工智能技术中,概率论与数理统计的知识占据重要的地位。数理统计理论有助于对机器学习算法和数据挖据的结果做出解释,只有做出百理的解1例,记X据Dw组方P比够体现。数理统计以概率论为基础,研究大量随机现家的统计规律性。根掂观宗头桠得到的数据来研究随机现象,并对研究对象的客观规律做出合理的估计和判断。

基础性的数理统计可以协助我们对机器学习算法及数据挖掘的结果进行统计、分析。只有经过科学、严谨的分析和处理,数据结果才能用于实际情况。这种数理统计可以迪过观察和研究,对数据、结果、信息做进一步纵回和横口的对比,同时进行科学的审查和预估,得出客观的结果。

尽管数理统计将概率作为理论来源,但两者之间有根本上的区别。概率论作用的前提是随机变量的分布已知,其根据已知的分布来分析随机变量的特征与规律﹔数理统计的研究对象则是分布未知的随机变量,其研究方法是对随机变量进行独立重复的观察,根据得到的观察结果对原始分布做出推断,数理统计可以看作逆向性的概率论。

若检验是通过随机抽取的样本来对一个总体的判断结果进行认可或否定,则可以将其用于估计机器学习模型的泛化能力。

四、最优化理论

人工智能的目标就是最优化,就是在复杂环境与多体交互中做出最优决策。几乎所有的人工智能问题最后都会归结为一个优化问题的求解,因此,最优化理论同样是学习、研究人工智能必备的基础知识。

最优化理论研究的问题是判定给定目标函数的最大值或最小值是否存在,并找到令目标函数取到最大值或最小值的数值。如果把给定的目标函数看成连绵的山脉,最优化的过程就是找到顶峰(谷底)且到达顶峰(谷底)的过程。

最优化理论的研究内容主要包括线性规划、(不)精确搜索、最速下降法、牛顿法、共辄梯度法、拟牛顿法、(非)线性最小二乘法、约束优化最优性条件、二次规划、罚函数法和信赖域法等。

1、目标函数

要实现最小化或最大化的函数称为目标函数,大多数最优化问题都可以通过使目标函数f(x)最小化解决,最大化间题也可以通过最小化f(x)来解决。实际的最优化方法可能找到的是目标函数的全局最小值,也可能是局部极小值,两者的区别在于全局最小值比定义域内所有其他点的函数值都小,而局部极小值只比所有邻近点的函数值小。

当目标函数的输入参数较多、解空间较大时,大多数实用的最优化方法都不能满足全局搜索对计算复杂度的要求,因而只能求出局部极小值。但是,在人工智能和深度学习的应用场景中,只要目标函数的取值足够小,就可以把这个值当作全局最小值使用,以此作为对性能和复杂度的折中。

2、线性规划

根据约束条件的不同,最优化问题可以被分为无约束优化和约束优化两类。无约束优化对自变量x的取值没有限制,约束优化则把x的取值限制在特定的集合内,也就是其要满足一定的约束条件。

典型的约束优化方法是线性规划,其解决的问题通常是在有限的成本约束下取得最大的收益。约束优化问题通常比无约束优化问题更加复杂,但通过引入拉格朗日乘子,可以将含有n个变量和k个约束条件的约束优化问题转化成含有n+k个变量的无约束优化问题。

3、梯度下降法

无约束优化问题最常用的方法是梯度下降法。梯度下降法是求解无约束优化问题最常用的方法,它是一种迭代方法。直观地说,梯度下降法就是沿着目标函数值下降最快的方向寻找最小值。当函数的输入为向量时,目标函数的图像就变成了高维空间上的曲面,此时的梯度就是垂直于曲面等高线并指向高度增加方向的向量,其携带了高维空间中关于方向的信息。而要让目标函数以最快的速度下降,就需要让自变量在负梯度的方向移动,用数学语言表示就是“多元函数沿其负梯度方向下降最快”。

梯度下降法实现简单,一般情况下,其解不保证是全局最优解。而当目标函数是凸函数时,梯度下降法的解是全局最优解。由于梯度下降法只用到目标函数的一阶导数,因而其下降的速度未必是最快的。

五、思考

1、微积分的主要思想是什么?微积分中哪些主要概念与人工智能相关?

微积分最重要的思想就是用"微元"与"无限逼近",好像一个事物始终在变化你不好研究,但通过微元分割成一小块一小块,那就可以认为是常量处理,最终加起来就行。 微积分学是微分学和积分学的总称。 它是一种数学思想,'无限细分’就是微分,'无限求和’就是积分。

在机器学习中,微积分主要用到了微分部分,作用是求函数的极值,就是很多机器学习库中的求解器所实现的功能,其中导数和偏导的定义与计算方法、梯度向量的定义、极值定理、泰勒展开式、拉格朗日乘数法等等都与人工智能相关。

2、如何理解线性代数的核心意义在于提供了一种看待世界的抽象视角?线性代数中的哪些内容能在人工智能中直接应用?

万事万物都可以被抽象成某些特征的组合,并在由预置规则定义的框架之下以静态和动态的方式加以观察。

标量、向量、张量:求模(大小)、向量夹角(点积或内积)、一个向量在另一向量上的投影以及依据自定义的轴向量对向量的描述和表示,矩阵、矩阵中的长度平方采样、奇异值分解、低秩逼近和SVD都能在人工智能中直接应用。

3、在机器学习中,数理统计方法与概率论方法在对待离散数据时有何不同。

这问题的答案有大佬知道吗?欢迎各位大佬前来评论,谢谢!

六、最后我想说

接下来我还会持续更新基础部分的内容,下期的内容是有关初等数学的知识。

谢谢阅读!期待得到你们支持!

  • 3
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
### 回答1: 机器学习数学理论机器学习领域中具有重要的地位。它是机器学习算法的理论基础,通过数学模型来描述和解释机器学习算法的原理和性能。 机器学习数学理论主要涉及统计学、优化方法、线性代数和概率论等数学知识。统计学提供了对数据的分析和建模方法,通过样本数据的统计特征来推导出模型的参数估计和预测能力。优化方法用于求解机器学习问题中的最优解,如最小化损失函数或最大化收益函数。线性代数则用于描述和处理数据的向量和矩阵,如特征向量和特征值分解等。概率论则是用于描述随机事件和不确定性,如概率分布和条件概率等。 机器学习数学理论的学习对于掌握机器学习算法至关重要。通过理解数学理论,可以更深入地理解机器学习算法的原理和假设,分析算法在不同数据集上的性能,并对算法进行优化和改进。同时,掌握数学理论也有助于更好地应用机器学习算法解决实际问题,选择合适的模型和参数以及评估模型的性能。 对于学习机器学习数学理论的人来说,可以通过学习相关的数学教材和课程来建立起扎实的数学基础。此外,还可以通过实践和实际应用来加深对数学理论的理解和应用能力。总之,机器学习数学理论机器学习领域不可或缺的一部分,对于从事机器学习研究和应用的人员来说,了解和掌握这些数学知识是非常重要的。 ### 回答2: 机器学习数学理论是一门研究机器学习算法和模型背后的数学原理的学科。在机器学习中,数学理论起到了至关重要的作用,它为机器学习提供了坚实的基础,并帮助我们理解算法的内在机制。 首先,机器学习数学理论涉及到概率论和统计学的知识。概率论是用来对不确定性进行建模的数学工具,而机器学习中的许多问题都有一定程度的不确定性,如分类、聚类和回归等任务。统计学则提供了分析和解释数据集的方法,帮助我们了解数据背后的规律和趋势。 其次,线性代数也是机器学习数学理论的重要组成部分。线性代数涉及到矩阵和向量的运算,这些运算在机器学习中广泛应用于特征表示、参数优化和模型预测等方面。通过线性代数的工具,我们可以对数据进行高效处理,并进行复杂模型的计算。 此外,凸优化是机器学习数学理论中的一个重要分支。优化理论用于解决如何找到使目标函数最小或最大化的变量值的问题,在机器学习中,我们经常需要通过优化算法来求解模型参数,以最大程度地拟合训练数据集,并在未见过的数据上表现良好。 最后,信息论也是机器学习数学理论的重要组成部分。信息论研究信息的量和信息的传输方式,而在机器学习中,我们需要通过信息论来评估特征的重要性、确定模型的复杂度以及度量模型预测的准确性等。 总而言之,机器学习数学理论机器学习领域不可或缺的一部分,它提供了数学和统计工具,帮助我们理解机器学习算法的原理,并为我们设计和调优模型提供了指导。通过学习机器学习数学理论,我们能够更好地应用和创新机器学习算法,解决现实世界中的问题。 ### 回答3: 机器学习数学理论 PDF 是一本关于机器学习中涉及的数学理论的电子书。这本书提供了机器学习背后的数学基础与原理,旨在帮助人们理解和应用机器学习算法。 机器学习是一门利用算法让计算机从数据中学习的科学和艺术。而数学机器学习中起着重要的角色,通过数学理论的支持,我们能够深入理解机器学习方法的原理和局限性。 这本 PDF 从基础数学理论出发,介绍了概率论、统计学和线性代数等数学领域的相关知识。它解释了在机器学习中常用的概念和技术,如回归分析、分类器、聚类和降维等。此外,它还介绍了几种常用的机器学习算法,例如决策树、支持向量机和神经网络,并通过数学推导和示例演示了算法的运作过程。 通过学习这本 PDF,读者可以系统地学习和掌握机器学习数学理论基础知识。它不仅可以帮助读者理解机器学习算法的原理,还可以帮助读者解读和分析其背后的数学模型、评估算法性能和调优模型参数。 总之,机器学习数学理论 PDF 是一本理论与实践相结合的指南,旨在帮助读者深入了解机器学习数学基础,并将其应用于实际问题中。通过学习这本书,读者可以更好地理解和应用机器学习算法,为解决现实世界中的各种问题提供有力的工具和方法。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

-北天-

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值