统计基础
lukeyyanghang
这个作者很懒,什么都没留下…
展开
-
大数定律
在数学与统计学中,大数定律又称大数法则、大数律,是描述相当多次数重复实验的结果的定律。根据这个定律知道,样本数量越多,则其算术平均值就有越高的机率接近期望值。大数定律很重要,因为它“说明”了一些随机事件的均值的长期稳定性。人们发现,在重复试验中,随着试验次数的增加,事件发生的频率趋于一个稳定值;人们同时也发现,在对物理量的测量实践中,测定值的算术平均也具有稳定性。 切比雪夫定理的一个特...原创 2019-01-21 21:38:04 · 3616 阅读 · 0 评论 -
各种距离
欧氏距离 差的平方求和开根某个点到另一个点的直线距离,它认为两点之间,始终是可以通过直线距离到达的(更适用于欧式空间) 曼哈顿距离差的绝对值求和开根曼哈顿距离也称为城市街区距离。在曼哈顿距离的世界里,规则是我们只能沿着线划出的格子行进。曼哈顿距离仍然只有之前欧氏距离的局限。在距离计算中,认为各个维度对于距离d的贡献权重是一样的。 切比雪夫距离国际...原创 2019-01-21 21:37:05 · 135 阅读 · 0 评论 -
中心极限定理
中心极限定理是概率论中的一组定理。中心极限定理说明,在适当的条件下,大量相互独立随机变量的均值经适当标准化后依分布收敛于正态分布。这组定理是数理统计学和误差分析的理论基础,指出了大量随机变量之和近似服从正态分布的条件。 参考WIKI:https://zh.wikipedia.org/wiki/%E4%B8%AD%E5%BF%83%E6%9E%81%E9%99%90%E5%AE%9A...转载 2019-01-21 21:33:19 · 293 阅读 · 0 评论 -
卡方分布
定义若n个相互独立的随机变量ξ₁,ξ₂,...,ξn ,均服从标准正态分布(也称独立同分布于标准正态分布),则这n个服从标准正态分布的随机变量的平方和构成一新的随机变量,其分布规律称为卡方分布(chi-square distribution)。 卡方检验卡方检验验其实是数理统计中一种常用的检验两个变量独立性的方法。卡方检验就是统计样本的实际观测值与理论推断值之间的偏离程度,实际...转载 2019-01-21 21:31:10 · 8093 阅读 · 0 评论 -
分位数
分位数(Quantile),亦称分位点,是指将一个随机变量的概率分布范围分为几个等份的数值点,常用的有中位数(即二分位数)、四分位数、百分位数等。ps:分位数肯定是先sort之后的值定义分位数指的就是连续分布函数中的一个点,这个点对应概率p。若概率0<p<1,随机变量X或它的概率分布的分位数Za,是指满足条件p(X≤Za)=α的实数 [1] 分位分箱应该就是等距分箱。...转载 2019-01-21 21:30:14 · 4549 阅读 · 0 评论 -
伯努利分布
伯努利分布又名0-1分布或者两点分布,是一个离散型概率分布。若伯努利试验成功,则伯努利随机变量取值为1。若伯努利试验失败,则伯努利随机变量取值为0。记其成功概率为p(0<=p<=1),失败概率为q=1-p。 ...转载 2019-01-21 21:28:52 · 6365 阅读 · 0 评论 -
凹凸函数
在函数f(x)的图象上取任意两点,如果函数图象在这两点之间的部分总在连接这两点的线段的下方,那么这个函数就是凹函数。直观上看,凸函数就是图象向上突出来的。比如如果函数f(x)在区间I上二阶可导,则f(x)在区间I上是凹函数的充要条件是f''(x)>=0;f(x)在区间I上是凸函数的充要条件是f''(x)<=0;通俗的讲,一个函数求了一阶导数(如大于O),只能说明是递增,但不知是...转载 2019-01-21 21:27:59 · 4109 阅读 · 0 评论