对数正态分布(Log-Normal Distribution)

最新推荐文章于 2024-07-08 21:27:42 发布

Payen_Cheung

最新推荐文章于 2024-07-08 21:27:42 发布

阅读量10w+

点赞数 28

分类专栏：机器学习小结文章标签：概率论与数理统计

本文链接：https://blog.csdn.net/absent1353/article/details/78415118

版权

机器学习小结专栏收录该内容

4 篇文章 1 订阅

订阅专栏

2017.11.1 人要有发耻心和羞耻心，突然想到了这么一句话，MARK一个博客

困惑了好久，还是写个博客Mark一下，方便以后查询使用

概率密度函数
局部期望

- 相关分布

概率密度函数

对数正态分布是对数为正态分布的任意随机变量的概率分布。如果 $Y$ 是正态分布的随机变量，则 $exp(Y)$ 是对数正态分布；同样，如果 $X$ 是对数正态分布，则 $ln(X)$ 为正态分布，如果一个变量可以看成是许多很小独立因子的乘积，则这个变量可以看作是对数正态分布。给定一个 $x>0$ ，对数正态分布的概率密度函数为：

f (x; μ; σ) = 1 2 π - - \sqrt x σ e - ( l n x - μ ) 2 2 σ 2

$f(x;\mu;\sigma)=\frac{1}{\sqrt {2\pi}x\sigma}e^{-\frac{(lnx-\mu)^2}{2\sigma^2}}$
其中，

μ $\mu$ 和

σ $\sigma$ 分别是变量对数的平均值和标准差。期望值和方差分别为：

E (X) = e μ + σ 2 / 2

$E(X)=e^{\mu+\sigma^2/2}$

v a r (X) = (e σ 2 - 1) e 2 μ + σ 2

$var(X)=(e^{\sigma^2}-1)e^{2\mu+\sigma^2}$
给定期望值与方差，也可以用这个关系求

μ $\mu$ 与

σ $\sigma$ 的大小

μ = l n (E (X)) - 1 2 l n (1 + v a r ( X ) E ( X ) 2)

$\mu=ln(E(X))-\frac{1}{2}ln(1+\frac{var(X)}{E(X)^2})$ 和

σ 2 = l n (1 + v a r ( X ) E ( X ) 2)

$\sigma^2=ln(1+\frac{var(X)}{E(X)^2})$
求解时，需要将

μ $\mu$ 和

σ $\sigma$ 计算出来带入到上面的

f(x;μ;σ) $f(x;\mu;\sigma)$ 中使用matlab带有的 logncdf和 lognpdf获取对数正态分布的累积分布函数和密度函数。
注解：已知变换后的数据的统计特征可以反过来推导出原始数据的统计特征，不存在数据信息的损失(对数转换后变量的均值可以直接由样本数据的均值得到，但不进行变化却需要由样本均值方法两方面去推断得到)，参见：机器学习小组知识点17 也可以发现对数正态分布实际上是对数据进行了对数变化，从而变成了正态分布，方便得到相关的统计学变量。

局部期望

随机变量 $X$ 在阈值 $k$ 上的局部期望定义为：

g (k) = \int \infty k (x - k) f (x) d x

$g(k)=\int_k ^\infty (x-k)f(x)dx$
其中

f(x) $f(x)$ 是概率密度，对于对数正态概率密度，这个定义为：

g (k) = e x p (μ + σ 2 / 2) Φ (- l n ( k ) + μ + σ 2 σ) - k Φ (- l n ( k ) + μ σ)

$g(k)=exp(\mu+\sigma^2/2)\Phi(\frac{-ln(k)+\mu+\sigma^2}{\sigma})-k\Phi(\frac{-ln(k)+\mu}{\sigma})$
其中

Φ $\Phi$ 是标准正态分布的累积分布函数，对数正态分布的局部期望在经济领域应用广泛。

参数的最大似然估计

为了确定对数正态分布参数 $\mu$ 和 $\sigma$ 的最大似然估计,可以采用与正态分布参数最大似然估计同样的方法。

f L (x; μ, σ) = 1 x f N (l n x; μ, σ)

$f_L(x;\mu,\sigma)=\frac{1}{x}f_N(lnx;\mu,\sigma)$
其中用

fL(⋅) $f_L(\cdot)$ 表示对数正态分布的概率密度函数，用

fN(⋅)−− $f_N(\cdot)--$ 表示正态分布，因此，用与正态分布同样的指数，我们可以得到对数最大似然函数：

l L (μ, σ | x 1, x 2, \dots, x n) = - \sum k l n x k + l N (μ, σ | l n x 1, l n x 2, \dots, l n x n) = c o n s t a n t + l N (μ, σ | l n x 1, l n x 2, \dots, l n x n)

$l_L(\mu,\sigma|x_1,x_2,\cdots,x_n)=-\sum_klnx_k+l_N(\mu,\sigma|lnx_1,lnx_2,\cdots,lnx_n)=constant+l_N(\mu,\sigma|lnx_1,lnx_2,\cdots,lnx_n)$
由于第一项相对于

μ $\mu$ 和

、sigma $、sigma$ 来说是常数，两个对数最大似然函数

lL $l_L$ 和

lN $l_N$ 在同样的

μ $\mu$ 和

σ $\sigma$ 处有最大值。因此，根据正态分布最大似然参数估计器的公式以及上面的方程，推导出对数正态分布参数最大似然估计为：

μ^= \sum k l n x k n, σ^2 = ( l n x k - μ ^ ) 2 n

$\hat\mu=\frac{\sum_klnx_k}{n},\hat\sigma^2=\frac{(lnx_k-\hat\mu)^2}{n}$

Payen_Cheung

关注

28
点赞
踩
170

收藏

觉得还不错? 一键收藏
2
评论
对数正态分布(Log-Normal Distribution)

2017.11.1 人要有发耻心和羞耻心，突然想到了这么一句话，MARK一个博客困惑了好久，还是写个博客Mark一下，方便以后查询使用概率密度函数局部期望- 相关分布快捷键加粗 Ctrl + B 斜体 Ctrl + I 引用 Ctrl + Q插入链接 Ctrl + L插入代码 Ctrl + K插入图片 Ctrl + G提升标题 Ctrl
复制链接

扫一扫

专栏目录