![ad1bc20ac8edd14b8d76fe05dca3ccdc.gif](https://img-blog.csdnimg.cn/img_convert/ad1bc20ac8edd14b8d76fe05dca3ccdc.gif)
本节主要就是讲述的机器学习的数学基础,提到数学基础,可能一眼就会是满眼的枯燥、没意思,但是成就英雄的路上注定了孤独,要想要真正的在学术上有所突破就必须挨得住寂寞,受得住孤独,才能真正的走进熟悉直到完全掌握机器学习的真谛,万事开头难,而且做什么事情都要打好地基,空中楼阁并不是现实中存在的,所以我们从本期课程开始再次从基础开始学习吧!本节内容为第三部分:概率。
![4d039b9dce17d3b233972d694343ffd1.gif](https://img-blog.csdnimg.cn/img_convert/4d039b9dce17d3b233972d694343ffd1.gif)
三、概率
3-1、为什么使用概率?
概率论是用于表示不确定性陈述的数学框架,即它是对事物不确定性的度量。
在人工智能领域,我们主要以两种方式来使用概率论。首先,概率法则告诉我们AI系统应该如何推理,所以我们设计一些算法来计算或者近似由概率论导出的表达式。其次,我们可以用概率和统计从理论上分析我们提出的AI系统的行为。
计算机科学的许多分支处理的对象都是完全确定的实体,但机器学习却大量使用概率论。实际上如果你了解机器学习的工作原理你就会觉得这个很正常。因为机器学习大部分时候处理的都是不确定量或随机量。
3-2、随机变量
随机变量可以随机地取不同值的变量。我们通常用小写字母来表示随机变量本身,而用带数字下标的小写字母来表示随机变量能够取到的值。例如,X1 和 X2 都是随机变量X可能的取值。
对于向量值变量,我们会将随机变量写成X,它的一个值为x。就其本身而言,一个随机变量只是对可能的状态的描述;它必须伴随着一个概率分布来指定每个状态的可能性。
随机变量可以是离散的或者连续的。
3-3、概率分布
给定某随机变量的取值范围,概率分布就是导致该随机事件出现的可能性。
从机器学习的角度来看,概率分布就是符合随机变量取值范围的某个对象属于某个类别或服从某种趋势的可能性。
![51bf3efde11937ba49363e3e444cf5ad.png](https://img-blog.csdnimg.cn/img_convert/51bf3efde11937ba49363e3e444cf5ad.png)
3-4、条件概率
很多情况下,我们感兴趣的是某个事件在给定其它事件发生时出现的概率,这种概率叫条件概率。
我们将给定X=x时Y=y发生的概率记为P(Y=y|X=x),这个概率可以通过下面的公式来计算:
![79605c0637fda40008514949905f237f.png](https://img-blog.csdnimg.cn/img_convert/79605c0637fda40008514949905f237f.png)
![23264d67d7adacb6daf242b5d3feaa41.png](https://img-blog.csdnimg.cn/img_convert/23264d67d7adacb6daf242b5d3feaa41.png)