![](https://img-blog.csdnimg.cn/20201014180756928.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
概率统计
文章平均质量分 86
AIGC人工智残
这个作者很懒,什么都没留下…
展开
-
置信区间proportion_confint和z检验proportions_ztest的用法
以(近似)1-alpha的置信度的下限和上限置信区间。当返回Pandas对象时,取“count”的索引值。原创 2023-07-07 10:49:49 · 516 阅读 · 0 评论 -
统计学——简单理解卡方检验
卡方检验用来分析两个分类变量之间是否显著相关,卡方检验属于非参数检验,由于非参检验不存在具体参数和总体正态分布的假设,所以有时被称为自由分布检验。而区别参数检验和非参数检验的,就是看数据类型,分类变量无法计算平均值和方差,所以为非参数检验。原创 2023-07-04 16:13:16 · 2553 阅读 · 1 评论 -
统计学——简单理解方差分析
方差分析(analysis of variance),简写为ANOVA,指的是利用对多个样本的方差的分析,得出总体均值是否相等的判定。它是一种分析调查或试验结果是否有差异的统计分析方法,也就是检验各组别间是否有差异。原创 2023-07-04 11:57:45 · 657 阅读 · 0 评论 -
统计学——全流程总结置信区间与假设检验
估计总体参数的一个具体值。:估计总体参数的一个区间。:对于一个我们永远无法知道总体的的情况下,我们通常用样本估计总体,那么我们估计的总体参数会有一个误差范围,这个误差范围就是置信区间。比如估计平均值中,我们用中括号[a,b]表示样本估计总体平均值的误差范围的区间,由于a和b的确切数值取决于你希望自己对于“该区间包含总体均值”这一结果具有的可信程度,因此,[a,b]被称为置信区间。:我们选择这个置信区间,目的是为了为了让“a和b之间包含总体平均值”这一结果具有特定的概率,这个概率就是置信水平。原创 2023-07-03 16:55:36 · 1772 阅读 · 0 评论 -
统计学——抽样与中心极限定理
总体是要研究对象的整个群体。:是从总体抽取一部分出来,代表总体情况的。:抽取这一部分的数量:从总体抽取部分,抽取几次。原创 2023-06-30 12:19:28 · 890 阅读 · 0 评论 -
统计学——条件概率和贝叶斯概率
一般记作PA∣B,意思是当B事件发生时,A事件发生的概率。原创 2023-06-29 18:06:35 · 245 阅读 · 0 评论 -
统计学——离散概率分布和连续概率分布
同样的条件下进行的相互独立的实验,特点是实验的可能结果只有两种。成功/失败。如果随机变量X是一次伯努利实验,则这个随机变量就符合伯努利分布。一次抛硬币就是典型的伯努利分布。原创 2023-06-28 13:26:13 · 1612 阅读 · 0 评论 -
统计学——协方差和相关系数
如果又引入一个随机变量年龄Z(year),年龄Z与体重X的协方差的单位为:year·kg,年龄Z与身高协方差的单位为:year·cm。我们计算所有矩阵的面积,最后的结果也为正数,这说明X,Y这两个随机变量整体上是正相关的关系;我们在平面坐标上先画出2个人的坐标点,然后以两个点画一个矩阵,为了后续更好的解释正负相关性,我们用红色表示正相关,蓝色表示负相关。接下来我们在该平面上引入第三个点,那么第三个点和前两个点分别组成矩阵,由于该同学比较瘦高,那么第三个点和前两个点呈负相关,呈蓝色,如下图所示。原创 2023-06-27 15:25:46 · 264 阅读 · 0 评论 -
统计学——概率分布、期望、方差
将随机事件的每一种结果赋予一个数字,根据变量是否连续分为两种:连续随机变量和离散随机变量。:随机变量的取值不连续,例如抛硬币。:随机变量的取值是连续的,例如一段绳子的长度。:用统计图来表示随机变量所有可能结果对应发生的概率。横轴是随机事件所有可能的结果(即随机变量的对应的数值),纵轴是对应每个结果发生的概率。我们之所以要将变量分为两种,因为不同类型的变量对于求概率的方法不同。原创 2023-06-27 17:57:25 · 351 阅读 · 0 评论