为什么逻辑回归要用sigmoid函数
Sigmoid是推导出来的,不是假设出来的, LR的假设是两个类服从均值不等,方差相等的高斯分布,然后通过贝叶斯决策推导
为什么假设服从高斯分布
(1) 因为高斯分布是比较容易处理的分布
(2) 从信息论的角度上看,当均值和方差已知时(尽管你并不知道确切的均值和方差,但是根据概率论,当样本量足够大时,样本均值和方差以概率1趋向于均值和方差), 高斯分布是熵最大的分布, 因为最大熵的分布可以平摊你的风险
参考文章
参考文章1
为什么逻辑回归要用sigmoid函数
Sigmoid是推导出来的,不是假设出来的, LR的假设是两个类服从均值不等,方差相等的高斯分布,然后通过贝叶斯决策推导
为什么假设服从高斯分布
(1) 因为高斯分布是比较容易处理的分布
(2) 从信息论的角度上看,当均值和方差已知时(尽管你并不知道确切的均值和方差,但是根据概率论,当样本量足够大时,样本均值和方差以概率1趋向于均值和方差), 高斯分布是熵最大的分布, 因为最大熵的分布可以平摊你的风险
参考文章
参考文章1