概率处理的相关问题

最新推荐文章于 2021-05-18 23:10:43 发布

手持电烙铁的侠客

最新推荐文章于 2021-05-18 23:10:43 发布

阅读量305

点赞数 2

分类专栏：人工智能

本文链接：https://blog.csdn.net/wang_jun_whu/article/details/104043043

版权

人工智能专栏收录该内容

9 篇文章 2 订阅

订阅专栏

                    
                    为什么在处理概率问题的时候，都会使用log(p(x)), 而不是p(x)的这种操作。
 主要有两个理由，(1) 在求最优解的过程中，如 
      
          p 
         
          ( 
         
          x 
         
          ) 
         
          = 
         
           e 
          
            − 
           
             x 
            
             2 
            
         p(x) = e^{-x^2} 
        
     p(x)=e−x2. 其本身的梯度scale得非常不好，当ｘ稍微大时，其值接近于０，此时就会要求学习率接近于无穷大。而其log函数性质就非常好，使得非常容易找到合适的x的步长。(2) 在涉及到多个概率连乘时，多个p(x)小值相乘就会导致概率接近于０，如一个位置的概率0.1, 观测到8次时候（连乘８次），就会超出浮点数的精度范围。如果此时取log相加，实际上是对其指数本身的一种操作，更容易计算机保存。

手持电烙铁的侠客

关注

2
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
概率处理的相关问题

为什么在处理概率问题的时候，都会使用log(p(x)), 而不是p(x)的这种操作。主要有两个理由，(1) 在求最优解的过程中，如p(x)=e−x2p(x) = e^{-x^2}p(x)=e−x2. 其本身的梯度scale得非常不好，当ｘ稍微大时，其值接近于０，此时就会要求学习率接近于无穷大。而其log函数性质就非常好，使得非常容易找到合适的x的步长。(2) 在涉及到多个概率连乘时，多个p(x...
复制链接

扫一扫