概率对统计和数据科学都及其重要
概率学的简单介绍**
什么是统计学(Statistics)?
高效利用数据来获取新知识的科学,获取和分析数据时需要不要违反道德约束。
Population: 我们需要从中获取信息或者得出某些结论的客体。有时候population很大,我们无法收集所有的信息,只能从population中的一部分sample中收集信息,以概括population.
什么是概率(probability)?
研究一件事情发生的可能性。或者说,通过一些数学理论基础来研究事件的随机性和不确定性
Experiment: any action or process that generates observations.
Sample space (denoted S): the set of all possible outcomes of an experiment.
Event: any possible outcomes.
Cardinality (基数):the number of outcomes it contain, denoted as |S|
事件A 与B的,并集,交集,非A或非B,空集等概念如下:
概率学公理(Axioms of Probability)
三条公理
1、任何一个事件发生的概率为 0<P(A)<1
2、一个实验所产生的所有可能结果的概率为1:P(S)=1
3、如果A1,A2, A3,。。。。An是互相没有交叉的事件,那么
公理3的延伸如下:当K为无穷大时,下面的概率为1
从概率公理得出的一些公式:
Example
数列(Permutations)与组合(combinations)
数列:从一个集合n中有顺序的取出K个objects, 就叫做 a permutation of size k, 记为Pk,n
n!=n(n-1)(n-2)(n-3)…3…2…1
0! = 1
组合:从一个集合n中取出k个objects,不考虑顺序,就叫做a combination, 记为Ck,n