2.6.2 ConvNeXt_trunc_normal_网络的代码注释

YANQ662

已于 2023-08-11 22:43:41 修改

阅读量74

点赞数

分类专栏： 1.Yolov5解释文章标签： YOLO pytorch 均值算法

于 2023-08-11 17:40:01 首次发布

本文链接：https://blog.csdn.net/weixin_71719718/article/details/132237335

版权

1.Yolov5解释专栏收录该内容

14 篇文章 1 订阅

订阅专栏

以下代码有几个函数的解释：

（1）高斯误差函数erf： $erf(x)=\frac{2}{\sqrt{\pi }}\int_{0}^{x}$ $e^{^{-t^{2}}}dt$ ,该函数是奇函数。

（2）uniform(x,y) 方法将随机生成下一个实数，它在 [x,y] 范围内。

（3）erfinv是erf函数的反函数，是逆误差函数，是把[-1,1]的数值映射到 $[-\infty ,+\infty ]$ 上。

（4）mul:乘法。

(5) add:加法。

(6) clamp(min=a, max=b):返回(min=a, max=b)之间的值，若大于b，则返回b，若小于a，则返回a。

代码解释如下：

def trunc_normal_(tensor, mean=0., std=1., a=-2., b=2.):
    def _no_grad_trunc_normal_(tensor, mean, std, a, b):
        def norm_cdf(x):
            #返回(1+x/根号2)/2
            return (1. + math.erf(x / math.sqrt(2.))) / 2.

        with torch.no_grad():

            l = norm_cdf((a - mean) / std)
            u = norm_cdf((b - mean) / std)

            #将tensor从均匀分布中抽样数值进行填充,填充的数值介于(2 * l - 1, 2 * u - 1)之间
            tensor.uniform_(2 * l - 1, 2 * u - 1)
            #逆误差函数erfinv_
            tensor.erfinv_()

            tensor.mul_(std * math.sqrt(2.))
            tensor.add_(mean)
            
            #tensor值返回(min=a, max=b)之间的值，若大于b，则返回b，若小于a，则返回a
            tensor.clamp_(min=a, max=b)
            return tensor
    return _no_grad_trunc_normal_(tensor, mean, std, a, b)

YANQ662

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
2.6.2 ConvNeXt_trunc_normal_网络的代码注释

将tensor从均匀分布中抽样数值进行填充,填充的数值介于(2 * l - 1, 2 * u - 1)之间。#tensor值返回(min=a, max=b)之间的值，若大于b，则返回b，若小于a，则返回a。#返回(1+x/根号2)/2。#逆误差函数erfinv_
复制链接

扫一扫