正太分布概述
正态分布是统计学中最重要和最广泛使用的分布。它有时被称为“钟形曲线”,虽然这种钟的音质不会令人满意。在数学家卡尔·弗里德里希·高斯之后,它也被称为“高斯曲线”。正如你将在关于正态分布历史的部分中看到的那样,尽管高斯在其历史中发挥了重要作用,但亚伯拉罕德莫维尔首先发现了正态分布
正太分布普遍规律
知乎上的回答点击前往
正太分布是普遍规律,神奇的是生活中很多是正太分布的例子。
比如人的升高,手臂长度,到考试成绩都符合正太分布
如下例子:
大部分人的智商是正常的,正态分布有点像2/8原则。
少数像爱因斯坦老爷子这样的智商太超常了
box-cox变换
在很多开源的nodebook看到很多人在特征工程时候会对某些特征X做box-cox变换鸡Y =log(1+x)
通过box-cox变换将特征分布正太化,使其更加符合数据分布的假设。