作为机器学习的入门课程:概率论
确定性现象:一定条件下必然出现的现象,比如物体下落,必然会掉到地面上
随机现象:我们事先无法准确预知结果的现象,比如投硬币,但我们无法预知投出的是正面还是反面
统计规律性:随机现象在大量重复时所表现出的量的规律性,尽管我们无法预知投硬币是正面还是反面,但是当我们投硬币的次数非常巨大时,会表现出一个很明显的规律,就是正面出现的次数接近反面出现的次数
试验:为了对随机现象的统计规律性研究,需要对随机现象进行观察
可重复性:试验可以在相同条件下重复进行
可观察性:每次试验的可能结果不止一个,并且能事先明确试验的所有可能结果
不确定性:每次试验出现的结果事先不能准确预知,但可以肯定的是会出现上面所有可能的结果之一
随机试验:具有可重复性、可观察性、不确定性的试验
样本点:随机试验的每一种可能的结果
样本空间:样本点的全体
事件:具有某一可观察特征的随机试验的结果
随机事件:在事件中可能发生也可能不发生的事件、
必然事件:在每次试验中必然发生的事件
不可能事件:在任何一次试验中都不可能发生的事件
基本事件:含有一个样本点
复合事件:含有两个或两个以上的样本点
事件的关系:包含,相等,并,交,差,互斥,对立,完备事件组
说一下互斥和对立的异同,相同的点是不管是互斥还是对立的两个事件,她们的交集都是空集,不同点是互斥的并没有要求两个事件的并集是全集,而对立是要求的。所以说对立事件必然是互斥的,但互斥不一定对立。
完备事件组:可以包含很多事件,所有这些事件的并集是全集,并且所有事件两两是互斥的。
事件的运算律:交换律、结合律、分配律、自反律、对偶律
概念有点多啊
不能一一列举了,大致说一下重要的。
频率和概率的区别:频率是实际试验的结果,比如投硬币,投了10000次,正面出现4953次,那么我们说出现正面的频率为4953/10000,而概率应该被理解成理论上的,所以很显然出现正面的概率应为1/2
概率的性质有很多,不细说了,注意一个很有意思的话,不可能事件的概率为0,反之不然,为什么呢?我举个例子,我在一个硬币的圆边上标记一个点,然后让硬币在桌子上滚动,假设硬币不倒,问硬币与桌面接触的那个点刚好是标记的点的概率,这个是一个几何概型的问题,因为点的长度为0,而硬币的圆周长是一个定值,那么这个概率按照几何概型计算应为0,但实际上这个是一个可能发生的事件。
古典概型:
(1)随机试验只有有限个可能的结果
(2)每个结果发生的可能性大小相同
几何概型:随机试验有无限可能的结果,但每个结果发生的可能性大小相同
事件的独立性:若两事件A,B满足:P(AB)=P(A)P(B),则称A,B相互独立
独立和互斥的区别:
互斥是指同一试验两个事件不能同时发生,即A和B的交集为空集,满足:P(AB)=0
而独立是表述同一试验中一事件发生与另一事件发生互不影响,满足:P(AB)=P(A)P(B)
显然即互斥又独立,则P(A)=0或者P(B)=0