-
定理:对于任意数集(data set),位于其均值(mean) K个标准差(SD)内的比例总是至少是1- 1 k 2 \frac{1}{k^2} k21,这里K为>1的任意实数【这个比例乘以总数就可以得到一个具体数值…人…个等】
-
由此可得一些特殊的点:
位于其mean2个标准差内的data比例至少为75%
位于其mean3个标准差内的data比例至少为89%
位于其mean4个标准差内的data比例至少为94% -
不等式:若R.V.X有mean和variance,那么对于每一个大于等于1的k,有
P ( ∣ X − μ ∣ > k σ ) ≤ 1 k 2 P(\vert X-\mu\vert>k\sigma)\le \frac{1}{k^2} P(∣X−μ∣>kσ)≤k21
或 或 或
P ( ∣ X − μ ∣ < k σ ) ≥ 1 − 1 k 2 P(\vert X-\mu\vert<k\sigma)\ge 1-\frac{1}{k^2} P(∣X−μ∣<kσ)≥1−k21
当 ϵ = k σ 当\epsilon=k\sigma 当ϵ=kσ
P ( ∣ X − μ ∣ > ϵ ) ≤ σ 2 ϵ 2 P(|X-\mu|>\epsilon)\le\frac{\sigma^2}{\epsilon^2} P(∣X−μ∣>ϵ)≤ϵ2σ2
注意➤
- 这里X指在RV可能出现的值中随便抽一个出来,去看它和整个RV的mean的差距,而不是说作为函数出现
- 切比雪夫只提供lower bound,精确度没有保证