截断正态分布stats.truncnorm()、nn.init.trunc_normal_()

Pengsen Ma

已于 2024-03-29 17:42:43 修改

阅读量2.7w

点赞数 9

分类专栏：机器学习基础文章标签：概率论

于 2021-10-06 11:26:38 首次发布

本文链接：https://blog.csdn.net/weixin_43135178/article/details/120622761

版权

机器学习基础专栏收录该内容

195 篇文章

订阅专栏

截断正态分布概念：

Normal Distribution 称为正态分布，也称为高斯分布，Truncated Normal Distribution一般翻译为截断正态分布。

截断正态分布是截断分布(Truncated Distribution)的一种，那么截断分布是什么？截断分布是指，限制变量xx 取值范围(scope)的一种分布。例如，限制x取值在0到50之间，即{0<x<50}。因此，根据限制条件的不同，截断分布可以分为：

限制取值上限，例如，负无穷<x<50
限制取值下限，例如，0<x<正无穷
限下限取值都限制，例如，0<x<50

正态分布则可视为不进行任何截断的截断正态分布，也即自变量的取值为负无穷到正无穷；例如下图，我们将正态分布的变量范围限制在【-3,3】内，那么我们就说我们截断了正态分布

想要截断范围的正态分布的意图

限制变量的取值范围：截断正态分布可以限制变量的取值范围，以使得分布更符合实际情况。在某些领域中，如金融领域中的股票价格，截断正态分布可以更好地描述实际情况，因为它将对变量的最大值和最小值进行限制。
减少异常值的影响：在实际数据中，存在一些极端值或异常值，这些值可能会对分析结果产生不良影响。通过截断正态分布，可以将这些异常值排除在分布范围之外，从而减少它们对分析结果的影响。
更好的模型拟合：在某些情况下，正态分布可能不能很好地拟合实际数据。通过截断正态分布，可以改善模型的拟合效果，提高拟合的准确性。【例如：想要去拟合数据，根据观察原始数据分布在1的左右，在使用GAN生成数据的时候发现拟合不到，那么猜想可能是我生成虚假数据的时候范围有问题，所以想要限制范围的正态分布】
更好的推断和预测：截断正态分布可以提高推断和预测的精度。在一些应用中，如概率统计、机器学习等领域，截断正态分布被广泛应用于数据建模和预测中。

截断了的正态分布还有正态的意义吗？

截断了的正态分布仍然有正态分布的意义。截断是指对正态分布进行了限制，使其只在某个区间内有定义。这种截断可能是单侧的或双侧的。截断的目的是限制变量的取值范围，以使得分布更符合实际情况。

截断了的正态分布仍然保留着正态分布的许多特征，比如它的均值、方差、标准差等。截断的影响主要表现在分布的尾部，即截断的区间之外。截断会使得分布在截断区间之外的概率变小，而在截断区间内的概率变大。

使用方法

分为两种

1、stats.truncnorm()

例如此时你想生成15个满足（0.5-1）之间的符合正太分布的值，那么你就可以使用截断分布来执行

应用：你可以使用这种方式进行随机mask图像的patch，例如MAGE，MDT都是这么干的...

import torch
import torch.nn as nn

import scipy.stats as stats

## 根据定义截断分布的上下界、均值方差, 取出size个值

# 定义截断分布的上下界（这个只是定义的，会根据均值方差进行调整到真实的上下界），均值方差
lower, upper, mean, std = -1, 1, 0.75, 0.25
# 取到的真实的值的上下界（0.5-1）
value_lower, value_upper = mean + lower * std, mean + upper * std
print(f"True value lower and upper is: {value_lower}, {value_upper}")
# 进行截断
X = stats.truncnorm(lower, upper, loc=mean, scale=std)
# 在截断分布中取15个值
x = X.rvs(size = 15)
print(x)
x = x[0]
print(x)

2、nn.init.trunc_normal_

语法

torch.nn.init.trunc_normal_(tensor, mean=0.0, std=1.0, a=- 2.0, b=2.0)

参数

tensor：[Tensor] 一个N NN维张量torch.Tensor
mean ：[float] 正态分布的均值
std ：[float] 正态分布的标准差
a：[float] 截断边界的最小值
b：[float] 截断边界的最大值

import torch
import torch.nn as nn


## 根据定义截断分布的上下界、均值方差, 对已知张量（这个张量可以是空的/非空的）进行截断，得到和输入张量一样形状的张量
tensor = torch.rand(3, 5)
lower, upper, mean, std = -2, 2, 0.0, 1.0
nn.init.trunc_normal_(tensor=tensor, mean=mean, std=std, a=lower, b=upper)