看其他篇章到目录 选择。
概率分布是概率论的一个基础。
在 Commons Math包中也专门有一个子包对概率分布进行了封装实现。在 distribution包中,定义了一个基本接口 Distribution。该接口只有两个方法,一个是 double cumulativeProbability (double x),一个是 double cumulativeProbability
(double x0, double x1)
。前者对于服从某种分布的随机变量X,返回P(X<=x);后者则返回P(x0<=X<=x1)。正如其名所示,这样也就得到了概率。
具体 distribution包中实现了基本所有的概率分布,分为连续型分布和离散型分布,连续型包括了像熟悉的指数分布、柯西分布等,离散型包括了泊松分布和二项分布等等。具体的类图结构见下图:
在连续型的 ContinuousDistribution接口中,添加了一个 double inverseCumulativeProbability (double p)的方法,这个方法返回 P(X<x)=p中的 x。也就是说通过已知概率,可以求得随机变量 X的 x范围。当然看 api文档还应注意一句,在 3.0的版本中会加入 public double density(double x)这个求概率密度函数的方法,敬请期待吧。离散型的接口 DiscreteDistribution中则添加了 double probability (double x)方法,用来计算 P(X=x)的概率。
具体的代码我们以离散型的泊松分布和连续型的正态分布来讲解。泊松分布的接口继承了 IntegerDistribution接口,在此基础上加了 getMean()方法和 normalApproximateProbability()方法。正态分布 NormalDistribution继承了 ContinuousDistribution,又添加了 getMean()方法和 double density(double x)方法以及 getStandardDeviation()方法。

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

31

32

33

34

35

36

37

38

39

40

41

42

43

44

45

46

47

48

49

50

51

52

53

54

55

56

57

58

59

60

61

62

63

64

65

66

67

68

69

70

71

72

73

74

75

76

77

78

输出:
P(X<=2.0) = 0.23810330555354414
mean value is 4.0
P(X=1.0) = 0.07326255555493674
P(X=x)=0.8 where x = 5
------------------------------------------
P(X<2.0) = 0.9772498680518208
mean value is 0.0
standard deviation is 1.0
P(X=1) = 0.24197072451914337
P(X<x)=0.8 where x = 0.8416212335731417
P(X<590) = 4.290603331968401E-4
P(X>605) = 0.047790352272814696
泊松分布只需要给定参数 λ 即可,而其期望就是 λ。所以构造方法一般就是new PoissonDistributionImpl(double mean)这样的形式了。
正态分布需要知道均值和方差,因此要在构造函数时传入,另外程序中以一个维基百科上的示例来验证正态分布的正确性。
相关资料:
概率分布: http://zh.wikipedia.org/zh-cn/%E6%A6%82%E7%8E%87%E5%88%86%E5%B8%83
泊松分布: http://zh.wikipedia.org/zh-cn/%E6%B3%8A%E6%9D%BE%E5%88%86%E5%B8%83
正态分布: http://zh.wikipedia.org/zh-cn/%E6%AD%A3%E6%80%81%E5%88%86%E5%B8%83
Commons math包: http://commons.apache.org/math/index.html