![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
统计学
文章平均质量分 70
小孔乘象k
这个作者很懒,什么都没留下…
展开
-
中心极限定理 central limit theorem
中心极限定理 central limit theorem中心极限定理是很多统计的基础,解释自然界中大多数数据属于正态分布,这使得正态分布在统计学中的应用非常广泛。「为什么中心极限定理能够解释数据属于正态分布,接下来我们就以不同类型的原始数据进行证明。」even if you’re not normal,the average is normal中心极限定理指的是给定一个任意分布的总体(除了无法计算均值的分布以外)。每次从这些总体中随机抽取 n 个抽样,一共抽 m 次。然后把这 m 组抽样分别求出平均值原创 2021-02-16 15:50:09 · 4496 阅读 · 0 评论 -
统计学三大相关性系数:pearson,spearman,kendall
在文献以及各种报告中,我们可以看到描述数据之间的相关性:pearson correlation,spearman correlation,kendall correlation。它们分别是什么呢?计算公式?怎样用R语言简单实现计算呢?本文一一介绍~建议前期阅读:协方差与相关系数-“傻傻”也能分清总的来讲,三个相关性系数(pearson, spearman, kendall)反应的都是两个变量之间变化趋势的方向以及程度,其值范围为-1到+1,0表示两个变量不相关,正值表示正相关,负值表示负相关,值越大表示原创 2021-02-14 12:16:45 · 3584 阅读 · 1 评论 -
R语言:无法精确计算带连结的p值
当你在使用cor.test,wilcoxon.test等这些函数时,不知道有没发现一个exact参数,以及是否遇到过无法精确计算带连结的p值这个warning。如果有,请往下看。这个问题应该是很常见的,《非参统计》书里写道:数据中有相同的数字,成为结(tie),结中的秩为按照升幂排列后位置的平均值,如果结多了,零分布的大样本公式就不准了,因此要做修正。”Example对于wilcox.test,是基于样本来自连续对称分布的总体,所以本不应该有相同的值,但是由于四舍五入,连续变量观测到的值都是离散原创 2021-02-14 12:01:12 · 15328 阅读 · 5 评论 -
协方差与相关系数-“傻傻”也能分清
目录协方差相关系数相关系数的p value相关系数与R2协方差协方差(covariance) 的主要思想之一,其可以将数据分为三类关系:正向趋势的关系(slope > 0)负向趋势的关系(slope < 0)无任何趋势的关系(slope = 0)协方差的计算公式暗示,协方差本身并不能告诉我们相关性直线的斜率(陡峭或平坦),也不能告诉我们样本是否靠近相关性直线,它仅仅告诉我们两变量之间的相关性直线的斜率是正还是负协方差本身的意义难以诠释,故我们不会以计算协方差为目标原创 2021-02-04 20:58:18 · 2221 阅读 · 0 评论