![](https://img-blog.csdnimg.cn/20201014180756922.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
统计学
文章平均质量分 84
行秋即离
若你困于无风之地
展开
-
基于R语言的方差分析
1、导入相关的包单因素方差分析一、正态性检验with(ToothGrowth, tapply(len, dosef, shapiro.test))二、方差齐性检验三组以上的因子需要用leveneTest()检验leveneTest(len~dosef, ToothGrowth)不过有一些教材认为应该用残差来检验正态性和方差齐性因此这里需要进行一次方差分析AOV1 <- aov(len~dosef, ToothGrowth)summary(AOV1)这里面的Residuals就原创 2021-01-27 20:22:15 · 3870 阅读 · 2 评论 -
aov()函数lm()函数区别,(I型、Ⅲ型平方和)
R:aov和lm方差分析的区别在R中经常会用aov()和lm()两个函数进行方差分析,aov 函数的内核使用了lm算法,但二者有一定的区别。aov() 默认(summary) 结果是基于Type I 平方和,而 lm() 默认(summary)的结果是Type III平方和。aov()分析的结果受自变量输入顺序的影响,而lm()与自变量输入顺序无关。当然这种差异是针对非平衡数据而言。对于平衡全处理的数据结构,二者分析的结果是一致的。Ⅲ型平方和与Ⅰ型平方和如果是等组设计,这几种平方和没有任何区别。不同转载 2021-01-13 17:40:30 · 4360 阅读 · 1 评论 -
常用的统计分析方法
分析方法频率分析主要用于查看数据基本分布特征,数据清晰,各种统计量、基本报告数据源等数据探索探索性分析主要是从统计的角度查看统计量来评估数据分布,主要用于异常值侦测、正态分布检验、数据分段、分位点测算等交叉表分析交叉分析、是市场研究的主要工作,大部分研究分析均使用,主要用于分析报告和分析数据源,各种图表等,当然其中也有卡方检验和T检验,寻找差异表(Table)分析类似于Excel的数据透视表,连续数据和离散数据均可使用,也可以用作卡方检验和T检验卡方检验它属于非参数检验的范畴,主要是比较原创 2020-12-27 12:53:30 · 9292 阅读 · 0 评论 -
方差齐性检验python实现
方差齐性在方差分析有一个重要的前提叫方差齐性先讲讲什么是方差齐性,方差齐性是指不同组间的总体方差是一样的。那为什么方差分析的前提是要组间的总体方差保持一致呢?先想想方差分析是做什么呢?方差分析是用来比较多组之间均值是否存在显著差异。那如果方差不一致,也就意味着值的波动程度是不一样的,如果此时均值之间存在显著差异,不能够说明一定是不同组间处理带来的,有可能是大方差带来大的波动;如果方差一样,也就意味着值的波动程度是一样的,在相同波动程度下,直接去比较均值,如果均值之间存在显著差异,那么可以认为是不同组间处原创 2020-12-26 19:45:56 · 5060 阅读 · 0 评论 -
方差分析python实现
单因素方差分析在此之间我们先导入数据,案例:我们探究施肥与否是否对植物的生长有影响,试验为: - 对照组:清水 - 实验组: 某肥料四个浓度梯度,分别是A,B,C,D,施肥一段时间之后测量树高(要控制其他变量保持一致,比如施肥之前的树高要基本保持一致,生长势基本保持一致等等)在方差分析满足,独立性,正态性,方差齐性,虽然没有满足方差齐性也可以进行非参数的检验,下面我们开始对数据进行处理import numpy as npimport pandas as pdimport matplotlib.p原创 2020-12-26 18:34:03 · 11764 阅读 · 2 评论 -
方差分析的SPSS实现
单因素方差分析1、首先打开我们的SPSS软件,将数据导入进去我们看到因子是group,我们研究的是不同的组别之间的均值是否有显著性差异,换句话说,假设我们的组别是不同的职业,1,2,3代表不同的职业,value是他们每天需要工作的时间,我们研究不同职业对于每天工作时间的差异我们知道要进行方差分析需要进行方差齐性正态性独立性按照上面的操作之后,就能得到有关方差分析的一些基本描述信息显著性这里是大于0.05的,说明方差是相等的下面是ANOVA的结果这里的显著性还是很明显的,只原创 2020-12-26 14:41:36 · 2272 阅读 · 0 评论 -
方差分析
方差分析基本术语实验设计和方差分析都有自己相应的语音。我们需要对一些重要的术语进行回顾,将有助于后续内容的理解和学习。为了研究某种药物对某种癌细胞株增值影响的研究为例例子:现在有两种药物:新研究的药物(Treat drug)和对照组药物(Control Drug),我们提取培养的10哥癌细胞株作为研究的对象,随机分配一般的癌细胞株接受为期96h的TreatDrug治疗,另外一半接受为期96h的Control Drug治疗。研究治疗结束的时候,对两组细胞株的细胞抑制率进行评估在这个实验中,治疗方案(Tr原创 2020-12-24 22:37:01 · 1918 阅读 · 1 评论 -
统计学假设检验和建模
1.经典t检验让我们在两个不同的场合下对一个赛车对的表现进行衡量,在第一次比赛中,团队的成员的得分为[79,100,93,75,84,107,66,86,103,81,89,105,84,86,86,112,112,100,94],在第二次比赛中,他们的得分为[92, 100, 76, 97, 72, 79, 94, 71, 84, 76, 82, 57, 67, 78, 94, 83, 85, 92, 76, 88]可以用下面的python语句生成这些数据并且用t检验来比较两组数据import n原创 2020-12-23 15:17:39 · 799 阅读 · 0 评论 -
两组之间的非参数检验:Mann-Whitney检验
Mann-Whitney检验曼-惠特尼U检验又称“曼-惠特尼秩和检验”,是由H.B.Mann和D.R.Whitney于1947年提出的。它假设两个样本分别来自除了总体均值以外完全相同的两个总体,目的是检验这两个总体的均值是否有显著的差别。可以看作是对两均值之差的参数检验方式的T检验或相应的大样本正态检验的代用品。由于曼-惠特尼秩和检验明确地考虑了每一个样本中各测定值所排的秩,它比符号检验法使用了更多的信息。如果两组的测量不是正态分布的,我们必须借助于非参数检验。比较两个独立组别最常用的非参数检验是M原创 2020-12-23 14:41:16 · 15980 阅读 · 1 评论 -
Wilcoxon符合秩和检验
在非正态分布的数据中,我们不应该使用单样本t检验(尽管这个检验对于偏离正态性相当稳健),相反,我们必须使用均值的非参数检验方法。我们可以进行Wilcoxon符号秩和检验。注意和单样本t检验不同,该检验检查是否有差异:(rank, pVal) = stats.wilcoxon(data-checkValue)该方法有3个步骤:计算每个观测值和感兴趣的值的差异;忽略差异的符号,将他们按照大小排序;将所有负(或正)秩次的秩次加起来,也就是那些低于(或高于)选定的假设值的秩次。在下面的表格中,你可原创 2020-12-23 14:32:19 · 9403 阅读 · 0 评论 -
假设检验中错误的类型
I类错误I类错误是指在无效假设是真的时候,结果是显著的,第一类错误的可能性经常用a表示,并且该值的数据分析前就确定,在质量控制中,第一类错误被叫作生产者风险,因为你在一个产品符合规范要求的情况拒绝了它简单来说就是不能拒绝原假设的时候拒绝了原假设II类错误和检验效能如果我们想回答这样一个问题:“当备择假设实际上是正确的时候,我们有多大可能拒绝原假设”,换句话说,我们检测出真实效果的可能性是多少?我们面临着一个不同的问题。要回答这些问题我们需要备择假设第二类错误是,尽管无效假设是错误的,但是结果不是很原创 2020-12-23 14:19:56 · 4359 阅读 · 0 评论 -
统计分析__卡方分布
卡方分布卡方分布是以一种很简单的方式和正态分布产生关联:如果一个随机变量X服从标准正态分布,那么X^2服从卡方分布,其自由度是1,n个独立的标准正态随机变量的平方和有n个自由度在这里插入图片描述举例一个药品制造商接到一个药品订单,需要发货的药品的标准差为0.05。从下一批次的药品开始,n=13的随机样本重量为3.04g, 2.94g, 3.01g, 3.00g, 2.94g, 2.91g, 3.02g, 3.04g, 3.09g, 2.95g, 2.99g, 3.10g, 3.02g。问题:标原创 2020-12-23 13:41:33 · 2866 阅读 · 0 评论 -
统计学__形状参数
分布形状的参数描述对于连续分布函数的特征是他们的位置和尺度。举两个例子:对于正态分布,(位置、形状)是由分布的(均值、标准差)给出的;对于均匀分布,它们由分布不同于零的范围(开始/开始—结束)给出的位置一个位置参数X0确定分布的位置或改变:位置参数的例子包括均值、中位数和众数综上可以简单理解成,这个分布的大概位置在哪里,还有就是分布的一些基本位置参数是什么尺度尺度参数描述了概率分布的宽度。如果尺度参数s较大,则分布将更加分散;如果s较小,则它将更加集中。如果s的所有的值都存在概率密度,那么原创 2020-12-23 13:12:38 · 6551 阅读 · 0 评论 -
关于统计学假设检验___自由度
自由度**自由度(DOF)**的概念在力学领域中似乎是非常清楚的,但是在统计应用中却很难掌握在我们学过的力学中,在一个平面上运动的粒子有“2个自由度”:在每一个时间点,两个参数(x,y坐标)定义粒子的位置。如果粒子在空间中移动,那么它具有“3个自由度”:x、y、z坐标。在统计中,具有n个值的一组数据有n个自由度。如果只看这些值的分布的形状,我们可以从每个值中减去样本均值。然后,剩下的数据只有n-1的自由度了但是在我们有很多组的时候,情况就会变得比较复杂了。例如,有一个22例患者被分为3组的例子,我们原创 2020-12-23 12:13:58 · 2420 阅读 · 0 评论 -
协方差分析
协方差(一)协方差分析基本思想通过上述的分析可以看到,不论是单因素方差分析还是多因素方差分析,控制因素都是可控的,其各个水平可以通过人为的努力得到控制和确定。但在许多实际问题中,有些控制因素很难人为控制,但它们的不同水平确实对观测变量产生了较为显著的影响。例如,在研究农作物产量问题时,如果仅考察不同施肥量、品种对农作物产量的影响,不考虑不同地块等因素而进行方差分析,显然是不全面的。因为事实上有些地块可能有利于农作物的生长,而另一些却不利于农作物的生长。不考虑这些因素进行分析可能会导致:即使不同的施肥量转载 2020-12-13 22:45:03 · 4177 阅读 · 0 评论 -
数据分布和统计分析
1、t检验两个均值差异与否:比较两样本连续的均值,以检验两均值的差异是否大于能被随机猜测所解释的差异应用条件观测值相互独立从正态分布的总体种抽样得到样本数据<30;如果>30,则使用正态曲线的z检验分类单样本t检验:某样本变量均数与给定总体一直均数相比是否有差异(网传正常成年人步速5km/h,对某大学生取样比较)独立样本t检验:检验由两独立样本估计的总体均数之间是否有差异(比较某一大学生男生和女生比较)配对样本t检验:检验两个相关样本估计的总体均数之间是否有差异(比较某转载 2020-12-13 22:20:30 · 2047 阅读 · 0 评论 -
统计方法基础
(1)数据的类型按照测量尺度分类名义变量(Normal Variable)举例:性别,人种无大小顺序等级之分顺序变量(Oridinal)举例:教育程度,喜好程度有大小顺序之分,差距不一定相同等距\区间变量(Interval Variable)举例:摄氏温度差距相同,任意零点,不能算倍数等比\比例变量(Ratio Variable)举例:绝对温度、身高、体重绝对零点,可算倍数/比率按照性质分类类别型(Categorical)数值型(Numerical)原创 2020-12-13 00:02:56 · 1899 阅读 · 1 评论