1、计数原理
从 n 个不同元素取出 m(m≤n) 个元素,按照一定的顺序排成一列,叫做从 n 个不同元素中取出 m 个元素的一个排列(arrangement).
从 n 个不同元素中取出 m(m≤n) 个元素的所有不同排列的个数叫做从 n 个不同元素中取出 m 个元素的排列数,用符号 A n m A_n^m Anm 表示.
A n m = n ( n − 1 ) ( n − 2 ) . . . ( n − m + 1 ) = n ! ( n − m ) ! A_n^m=n(n-1)(n-2)...(n-m+1)=\frac{n!}{(n-m)!} Anm=n(n−1)(n−2)...(n−m+1)=(n−m)!n!
从 n 个不同元素中取出 m(m≤n) 个元素合成一组,叫做从 n 个元素中取出 m 个元素的一个组合(combination).
从 n 个不同元素中取出 m(m≤n) 个元素的所有不同组合的个数,叫做从 n 个不同元素中取出 m 个元素的组合数,用符号 C n m C_n^m Cnm 表示.
A n m = n ! m ! ( n − m ) ! A_n^m=\frac{n!}{m!(n-m)!} Anm=m!(n−m)!n!.
C n 0 = 1 C_n^0=1 Cn0=1.
C n m = C n n − m C_n^m=C_n^{n-m} Cnm=Cnn−m
C n + 1 m = C n m + C n m − 1 C_{n+1}^m=C_n^m+C_n^{m-1} Cn+1m=Cnm+Cnm−1
1.1、二项式
二项式定理(binomial theorem):
( a + b ) n = C n 0 a n + C n 1 a n − 1 b + . . . + C n k a n − k b k + . . . + C n n b n (a+b)^n=C_n^0a^n+C_n^1a^{n-1}b+...+C_n^ka^{n-k}b^k+...+C_n^nb^n (a+b)n=Cn0an+Cn1an−1b+...+Cnkan−kbk+...+Cnnbn
2、随机变量及其分布
2.1、离散型随机变量及其分布列
随着实验结果变化而变化的变量称为随机变量(random variable).
所有取值可以一一列出的随机变量,称为离散型随机变量(discrete random variable).
概率分布列(probability distribution series),简称分布列.
X | 0 | 1 |
---|---|---|
P | 1-p | p |
如上表,随机变量 X 服从两点分布(two-point distribution),称 p=P(X=1) 为成功概率.
X | 0 | 1 | … | m |
---|---|---|---|---|
P | C M 0 C N − M n − 0 C M n \frac{C_M^0C_{N-M}^{n-0}}{C_M^n} CMnCM0CN−Mn−0 | C M 1 C N − M n − 1 C M n \frac{C_M^1C_{N-M}^{n-1}}{C_M^n} CMnCM1CN−Mn−1 | … | C M m C N − M n − m C M n \frac{C_M^mC_{N-M}^{n-m}}{C_M^n} CMnCMmCN−Mn−m |
如上表,随机变量 X 服从超几何分布(hypergeometric distribution).
2.2、二项分布及其应用
P ( B ∣ A ) = P ( A B ) P ( A ) P(B|A)=\frac{P(AB)}{P(A)} P(B∣A)=P(A)P(AB) 表示在事件 A 发生的条件下,事件 B发生的条件概率(conditional probability),其中 P(AB)表示 A 和 B 同时发生的概率.P(B|A) 读作 A 发生的条件下 B 发生的概率.
如果 B 和 C 是两个互斥事件,则有 P ( B ∪ C ∣ A ) = P ( B ∣ A ) + P ( C ∣ A ) P(B∪C|A)=P(B|A)+P(C|A) P(B∪C∣A)=P(B∣A)+P(C∣A).
若 P ( A B ) = P ( A ) P ( B ) P(AB)=P(A)P(B) P(AB)=P(A)P(B),则称事件 A 与事件 B 相互独立(mutually independent).
一般地,在相同条件下重复做的 n 次试验称为 n 次独立重复试验(independent and repeated trials).
一般地,在 n 次独立重复试验中,用 X 表示事件 A 发生的次数,设每次试验中事件 A 发生的概率为 p,则有
P
(
X
=
k
)
=
C
n
k
p
k
(
1
−
p
)
n
−
k
,
k
=
0
,
1
,
2
,
.
.
.
,
n
.
P(X=k)=C_n^kp^k(1-p)^{n-k},k=0,1,2,...,n.
P(X=k)=Cnkpk(1−p)n−k,k=0,1,2,...,n.
此时称随机变量 X 服从二项分布(binomial distribution),记作 X ~
B
(
n
,
p
)
B(n,p)
B(n,p),并称 p 为成功概率.
2.3、离散型随机变量的均值与方差
一般地,若离散型随机变量 X 的分布列为
X | x 1 x_1 x1 | x 2 x_2 x2 | … | x i x_i xi | … | x n x_n xn |
---|---|---|---|---|---|---|
P | p 1 p_1 p1 | p 2 p_2 p2 | … | p i p_i pi | … | p n p_n pn |
则称 E ( x ) = x 1 p 1 + x 2 p 2 + . . . + x i p i + . . . + x n p n E(x)=x_1p_1+x_2p_2+...+x_ip_i+...+x_np_n E(x)=x1p1+x2p2+...+xipi+...+xnpn 为随机变量 X 的均值(mean) 或数学期望(mathematical expectation).
E ( a X + b ) = a E ( X ) + b . E(aX+b)=aE(X)+b. E(aX+b)=aE(X)+b.
若 X ~ B ( n , p ) B(n,p) B(n,p),则 E(X)=np.
设离散型随机变量 X 的分布列为
X | x 1 x_1 x1 | x 2 x_2 x2 | … | x i x_i xi | … | x n x_n xn |
---|---|---|---|---|---|---|
P | p 1 p_1 p1 | p 2 p_2 p2 | … | p i p_i pi | … | p n p_n pn |
D ( X ) = ∑ i = 1 n ( x i − E ( X ) ) 2 p i D(X)=\sum_{i=1}^n(x_i-E(X))^2p_i D(X)=∑i=1n(xi−E(X))2pi,D(X) 为随机变量 X 的方差(variance), D ( X ) \sqrt[]{D(X)} D(X) 为随机变量 X 的标准差(standard deviation).
若 X 服从两点分布,则
D
(
X
)
=
p
(
1
−
p
)
D(X)=p(1-p)
D(X)=p(1−p);
若 X ~B(n,p),则 $D(X)=np(1-p)).
D ( a X + b ) = a 2 D ( X ) D(aX+b)=a^2D(X) D(aX+b)=a2D(X).
2.4、正态分布
φ μ , σ ( x ) = 1 2 π σ e − ( x − μ ) 2 2 σ 2 , x ∈ ( − ∞ , + ∞ ) φ_{μ,σ}(x)=\frac{1}{\sqrt[]{2π}σ}e^{-\frac{(x-μ)^2}{2σ^2}},x∈(-∞,+∞) φμ,σ(x)=2πσ1e−2σ2(x−μ)2,x∈(−∞,+∞)
其中 μ 和 σ(σ>0) 为参数, φ μ , σ ( x ) φ_{μ,σ}(x) φμ,σ(x) 的图像为正太分布密度曲线,简称正态曲线.
X 落在区间(a,b] 的概率为 P ( a < X ≤ b ) = ∫ a b φ μ , σ ( x ) d x P(a<X≤b)=\int_a^bφ_{μ,σ}(x)dx P(a<X≤b)=∫abφμ,σ(x)dx.
正太分布记作 N ( μ , σ 2 ) N(μ,σ^2) N(μ,σ2),随机变量 X 服从正态分布,记为 X ~ N ( μ , σ 2 ) N(μ,σ^2) N(μ,σ2).
正态曲线特点:
- 曲线位于 x 轴的上方,与 x 轴不相交;
- 曲线是单峰的,它关于直线 x=μ 对称;
- 曲线在 x=μ 处达到峰值 1 σ 2 π \frac{1}{σ\sqrt[]{2π}} σ2π1;
- 曲线与 x 轴之间的面积为 1;
μ 反应随机变量取值的平均水平的特征数,曲线随着 μ 的变化沿 x 轴平移;
σ 越小,曲线越瘦高,总体分布越集中;σ 越大,曲线越矮胖,总体的分布越分散.
3、回归分析
- 样本点的中心;
- 随机误差;
- 解释变量;
- 预报变量;
- 残差;
- 独立性检验;
4、参考资料
普通高中课程标准实验教科书——数学2-3(选修)[ISBN 978-7-107-20171-4]