机器学习|随机变量(连续型、离散型)+分布函数|10mins入门|概统学习笔记(一)

1.随机试验、随机事件、样本空间

  • 随机试验:每次出现的可能结果不止一个,且事先不能肯定会出现哪一个结果的试验

  • 随机事件:在一次试验中可能发生也可能不发生的事件

    • 分类:
      • 基本事件:相对于观察目的不可再分解的事件
      • 复合事件:两个及以上基本事件合并
    • 随机事件的概率:1P(A)01 \geq P(A)\geq 0表示事件A发生概率
  • 样本点:随机试验的每个基本结果,记作ee

  • 样本空间:全体样本点的集合,记作SS

在这里插入图片描述
e.g 掷骰子

S={i:i=1,2,3,4,5,6}S=\{i:i=1,2,3,4,5,6\}

2. 随机变量

  • 随机变量:定义在样本空间上的实值函数,简称为r.v.r.v.

    • 把随机试验结果数值化

    • 随试验结果的不同而取不同的值,在试验之前只知道它可能的取值范围,而不能预先肯定它将取的值

    • 由于试验结果的出现具有一定的概率,于是这种实值函数取每个值和每个确定范围内的值也有一定的概率。

    • 随机变量通常用大写字母表示X,Y,ZX,Y,Zζ,η\zeta,\eta,而随机变量所取的值,通常用小写字母x,y,zx,y,z表示
      在这里插入图片描述

    • 分类:

      • 离散型随机变量:所有取值可以逐个一一列举
      • 连续型随机变量:全部可能取值无穷多
    • 随机事件与随机变量区别:

      1)随机变量包括随机事件

      2)随机变量是动态的观点,随机事件是静态的观点,如数学分析中常量与变量的区别

  • 离散型随机变量

    • 离散型随机变量X的概率函数(或分布律,或概率分布)

      xk(k=1,2,...)x_k(k=1,2,...)是离散型随机变量X所取的一切可能值,称
      P(X=xk)=pk,k=1,2,... P(X=x_k)=p_k, k=1,2,...
      其中pk(k=1,2,...)p_k(k=1,2,...)满足:

      (1) pk0,k=1,2,...p_k \geq 0,k=1,2,...

      (2) kpk=1\sum_kp_k=1

    • 离散型随机变量X的概率规律

    在这里插入图片描述
    在这里插入图片描述

    • 离散型随机变量由它的概率函数唯一确定
  • 连续型随机变量

    • 连续型随机变量X的概率密度函数

      对于随机变量,如果存在非负可积函数f(x),x(,+)f(x),x \in (-\infty,+\infty),使得对任意aba \leq b,有
      P(aXb)=abf(x)dx P(a \leq X \leq b)=\int_a^bf(x)dx
      则称X为连续型r.vr.v,称f(x)f(x)为X的概率密度函数,简称为概率密度。

      其中f(x)f(x)满足:

      (1)f(x)0f(x)\geq 0

      (2)f(x)dx=1\int_{-\infty}^{\infty}f(x)dx=1

在这里插入图片描述

  • f(x)f(x)进一步理解:

    xxf(x)f(x)的连续点,则:
    limΔx0p(x<Xx+Δx)Δx=limΔx0xx+Δxf(t)dtΔx=f(x) lim_{\Delta x\to 0}\frac{p(x<X\leq x+\Delta x)}{\Delta x}=lim_{\Delta x\to0}\frac{\int_x^{x+\Delta x}f(t)dt}{\Delta x}=f(x)
    故X的密度f(x)f(x)在x这一点的值,恰好是X落在区间(x,x+Δx](x,x+\Delta x]上的概率与区间长度Δx\Delta x之比的极限。这里,如果把概率理解为质量,f(x)f(x)相当于线密度。

    密度函数f(x)f(x)在某点处aa的高度,并不反映X取值的概率。但是,这个高度越大,则X取aa附近的值的概率就越大。这说明某点密度曲线的高度反映了概率集中在该点附近的程度。

  • 连续型随机变量取任一指定值的概率为0

    即:P(X=a)=0P(X=a)=0aa为任一指定值

    P(x=a)=limΔx0P(aX<a+Δx)=limΔ0aa+Δxf(x)dx=0\because P(x=a)=lim_{\Delta x \to 0}P(a\leq X<a+\Delta x)=lim_{\Delta \to 0}\int_a^{a+\Delta x}f(x)dx=0

  • 连续型随机变量唯一被它的密度函数所确定,所以,若已知密度函数,该连续型随机变量的概率规律就得到了全面描述

3.分布函数

  • 背景:为了对离散型的和连续型的r.vr.v以及更广泛类型的r.vr.v给出一种统一的描述方法,引进了分布函数的概念。它是一个普通的函数,通过它,我们可以用数学分析的工具来研究随机变量。

  • 定义:设X是一个r.vr.v,称

    F(x)=P(Xx),(<x<+) F(x)=P(X\leq x),(-\infty<x<+\infty)​
    XX的分布函数,记作XX~F(x)F(x)FX(x)F_X(x)

    上式中XX是随机变量,xx是参变量。F(x)F(x)是随机变量XX取值不大于xx的概率。

    如果将X看作数轴上随机点的坐标,那么分布函数F(x)F(x)的值就表示X落在区间(,x](-\infty,x]的概率。

    对任意实数x1<x2x_1<x_2 ,随机点落在区间(x1,x2](x_1,x_2]的概率为:
    P{x1<Xx2}=P{Xx2}P{Xx1}=F(x2)F(x1) P\{x_1<X\leq x_2\}=P\{X\leq x_2\}-P\{X\leq x_1\}=F(x_2)-F(x_1)​
    因此,只要知道了随机变量XX的分布函数,它的统计特性就可以得到全面的描述

  • 分布函数的性质:

    (1)F(x)F(x)非降,即若x1<x2x_1<x_2,则F(x1)F(x2)F(x_1)\leq F(x_2)

    (2)F()=limxF(x)=0F(-\infty)=lim_{x\to -\infty}F(x)=0

    F(+)=limx+F(x)=1F(+\infty)=lim_{x\to +\infty}F(x)=1

    (3)F(x)F(x)右连续,即limxx0+F(x)=F(x0)lim_{x\to x_0^+}F(x)=F(x_0)

  • 离散型随机变量的分布函数

    设离散型随机变量XX的概率函数是
    P{X=xk}=pk,k=1,2,3,... P\{X=x_k\}=p_k, \quad k=1,2,3,...

    F(x)=P(Xx)=xkxpk F(x)=P(X\leq x)=\sum_{x_k\leq x}p_k
    由于F(x)F(x)XxX\leq x的诸值xkx_k的概率之和,故又称F(x)F(x)为累积概率函数

  • 连续型随机变量的分布函数

    XX是连续型随机变量,XX~f(x)f(x),则
    F(x)=P(Xx)=xf(t)dt F(x)=P(X\leq x)=\int_{-\infty}^xf(t)dt
    即分布函数是密度函数的可变上限不定积分

    由上式可得,在f(x)f(x)的连续点处,有
    dF(x)dx=f(x) \frac{dF(x)}{dx}=f(x)

在这里插入图片描述

发布了35 篇原创文章 · 获赞 0 · 访问量 695
展开阅读全文

没有更多推荐了,返回首页

©️2019 CSDN 皮肤主题: 数字20 设计师: CSDN官方博客

分享到微信朋友圈

×

扫一扫,手机浏览