集成学习专项（一）数学基础

最新推荐文章于 2023-10-10 20:53:13 发布

'仰望星空,脚踏实地'-菱

最新推荐文章于 2023-10-10 20:53:13 发布

阅读量288

点赞数

分类专栏：机器学习基础

本文链接：https://blog.csdn.net/weixin_44365744/article/details/119766820

版权

6 篇文章 0 订阅

订阅专栏

机器学习补充数学基础

呼叫流
设 ${N(t) \}$ 是强度为$\lambda $的泊松过程，定义$ S_0=0 $，用$ S_n $表示第 n 个事件发生的时刻，简称为第 n 个到达时刻或者第 n 个呼叫时，由于$ S_0,S_1,…,S_n $依次到达，所以又称$ {S_t } $为泊松过程$ {N(t) }$的呼叫流。
基本关系：
$\{N(t)\ge n \} = \{S_n\le t \}\\ \{N(t)= n \} = \{S_n\le t<S_{n+1} \}$
等待间隔：设 ${S_n \}$ 是泊松过程 ${N(t) \}$ 的呼叫流，引入 $X_n=S_n-S_{n-1},n=1,2,...$ ，则 $X_n$ 是第n-1个事件之后等待第n个事件发生的等待间隔，称为第n个等待间隔。
泊松过程 ${N(t) \}$ 的等待间隔 $X_1,...,X_n,...$ 是来自指数总体 $\epsilon(\lambda)$ 的随机变量。
证明：首先考虑 $X_{1}$ 的分布，注意到事件 $\left\{X_{1}>t\right\}$ 等价于事件 ${N(t)=0\},$ 即 $(0, t]$ 时间内没有事件发生。因此
$P\left\{X_{1}>t\right\}=P\{N(t)=0\}=\mathrm{e}^{-\lambda t}$
从而
$P\left\{X_{1} \leqslant t\right\}=1-\mathrm{e}^{-\lambda t}$
再来看 $X_{2}:$
$P\left\{X_{2}>t \mid X_{1}=s\right\}=P\left\{N(s+t)-N(s)=0 \mid X_{1}=s\right\} =P{N(s+t)-N(s)=0}(独立增量性)=\mathrm{e}^{-\lambda t}$
所以 $X_{2}$ 与 $X_{1}$ 独立，且都服从参数为 $\lambda$ 的指数分布。重复同样的推导，可得定理结论。

牛顿法：是通过求解目标函数的一阶导数为0时的参数，进而求出目标函数最小值时的参数。
收敛速度很快。
海森矩阵的逆在迭代过程中不断减小，可以起到逐步减小步长的效果。
缺点：海森矩阵的逆计算复杂，代价比较大，因此有了拟牛顿法。
梯度下降法：是通过梯度方向和步长，直接求解目标函数的最小值时的参数。
越接近最优值时，步长应该不断减小，否则会在最优值附近来回震荡。