我们以马尔科夫链为例,来看看如何将数学理论应用在实际学习中。马尔科夫是随机过程中的一个在预测领域经常应用的理论。
学习某种数学的算法或者理论,总结起来无非是以下几个方面,掌握学习规律后,我们可以根据自己的实际情况,对不同部分的学习,给予取舍:
1、原理或定理的由来。
这点其实是最难的部分,要求有扎实的数学功底,包括了从无到有的推理过程,算法的证明,来龙去脉等。数学常常是抽象中的抽象,一门学科常常以前面的若干学科为基础,因此有时候单看一个理论是很难一管窥豹的。建议如果对数学知识基础不扎实,其实完全可以忽略这部分。而只要记住结论,记住公式。我们只要知道,这个算法的应用领域,适用范围等即可。当然最好要大致了解这个理论在整个架构中的位置,这样方便我们整理自己的知识架构。
例如马尔科夫是随机过程中的一个概念。通过下面的分析,我们大致就了解马尔科夫的适用范围和再随机过程中的大致的位置。
随机过程可以看做是一个从参数集(T)到状态空间(E)的映射。也就是由参数集中的随机变量构成的函数。
而按照参数集和状态空间的类型,可以分为:离散参数链、非离散参数链、随机序列、随机函数。
根据概率的机构,随机过程分为:独立增量过程、平稳过程、非平稳过程、马尔科夫过程等。
这里著名的泊松过程就是T连续,E离散的平稳过程;马尔科夫链就是T和E均离散的马尔科夫过程。
2、原理或算法的约束条件的逐步强化
这是用以简化问题研究。其实提出越严苛的条件,越有利于我们对理论的快速理解。原理的推理过程大多是从普遍规律推到特殊情况,条件逐渐加强,而其实有时候可以从严苛条件反推回去看宽松条件的定理,学习起来更轻松。往往为了简化某个公式或者某个理论,往往会对算法进行简化。
比如在马尔科夫链中,一开始不太好理解,但是随着条件的加强,概念反而越来越清晰。
1)首先是马氏链:也就是当前的状态与过去的状态无关,也就是随机出现的。例如青蛙跳荷叶、醉汉走步等。这样就约束了,状态之间的关系。
2)接下来是与时间的无关性,也就称为齐次。也就是条件概率与当前的时间无关,换句话说,无论什么时候,条件概率是一样的。这样就得到了齐次马氏链。
3)弱依赖性。这个应该算是条件也算是性质。本来在计算预测中最担心的是多元素的互相依赖。而马链却很好的有个弱依赖性,也就是当前点只依赖于前一个点。正因为有了这个弱依赖性,使得,我们可以从初始状态推测出后面无数点的预测状态。(第三大点的第1点说明)
根据这个弱依赖性,我们就可以做一个转移矩阵P了。这个转移矩阵的每个值,就是表示上一点,到本点的概率。
其中Pij,是指当前状态为i的情况下,转移到j的条件概率。
所以有:P00+P01+...+P0m=1