随机区组化实验设计(RCBD)和线性模型(Linear Models)

Fixed effects or Random effects

10个人服用药物,10个不同的个体的血压不同,即随机效应;

总的看这种药物是不是有效果——固定效应。使用单因素方差分析,双因素方差分析等。

1.效应值是否感兴趣 

2.因子是否含有信息量     e.g.,放牧是不是对草场有影响(并不关注每家每户增加收益有多少)

3.设计实验时有没有人为的操控    如果是,这就是固定效应

 (?)总的平方和-随机效应的平方和

比较随机平方和和中间平方和占的比例

完全随机实验设计

优势:最高自由度(不涉及随机区组化),统计功效比较强(简单方差分析即可)

缺点:潜在环境干扰很大(左侧公路,右边池塘都存在干扰),误差棒较大

容易出现二类错误(因为统计方法的选用,模糊了原有的差异性),忽视了原有的格局。

从左到右,干旱到湿润,施肥效应的影响被环境遮掩掉了,应该把土壤含水量也考虑进去,无论是SWC还是施肥都能对粮食产量产生促进作用

环境梯度影响遮蔽了原有差异(调查区域常绿树木应该高于落叶,但因高低海拔差异,误差棒很大)

设计三个block,低海拔测常绿阔叶,中海拔选取一个样方,高海拔同样选取一个样方(上等马对上等马)。通过block,控制环境梯度产生的差异

同样对树种、海拔产生的高度差异感兴趣。可以把海拔也作为一个影响的固定效应。如果不关注,应该把海拔设成随机效应

怎么去掉产生影响的随机因子(潜在变量产生的方差)

通过分组,设计成类似田忌赛马中的分组,把潜在环境变量产生的影响扣除掉。

随机区组化实验设计(RCBD),是野外试验首先要考虑选择的实验设计方法。

 室内试验——为了避免光照、摆放位置、高度等因素产生的影响,也可以通过RCBD,尽可能均匀化,控制误差来源,帮助我们得到显著的结果。

设计Block的目的,使得Block内部的条件差不多,而Block之间的差异尽可能的大(上图Bolok竖着排)

野外实验——设计的时候,形状尽可能规律规整(正方形),使得Block内部的差异尽可能的小。多变的

e.g., 根据小花草玉梅幼苗的株高(表征长势情况),1-20高度排序,最高的两个一个施肥,一个不施肥,依次递推。把株高作为环境变量,作为随机效应排序的依据。

 线性混合效应模型(lmer函数拟合)https://blog.csdn.net/weixin_43645790/article/details/125478197https://blog.csdn.net/weixin_43645790/article/details/125478197

Y~Treatment + [Block/Treatment]

 一堆样方绑成一个Block,每个Block里面都有配套的处理(e.g.,每个Block里面都有施氮肥、施磷肥、不施肥)  一亩地有6个Block,每个Block有3个Treatment

(假如实验设计本身含有Block,在写模型的时候不可以删除)

数据比较多,计算的时候费时多,比较麻烦

劣势:1.df、R2有时候不好计算      2.把混合线性模型纳入SEM(结构方程模型)比较麻烦,后续才较好的解决了。

F值表示处理之间的差异,期望越大越好

分子:组间差异

分母:误差平方和Error SS     

除以自由度(error df),防止方差膨胀。减小样本量膨胀导致的数据的变异,产生一个无量纲的数

左侧柱图,Treatment小;Error大,对应的自由度大,F值小

右侧柱图,设置Block后,Block本身又会解释一些误差平方和,而这块就在Error块中。这使得分母大幅度减小,使得F统计量变大,倾向于得到一个大的F数值,帮助我们更容易得到一个显著的统计结果。Error对应的自由度被带走一部分,Error-Block=剩余的新自由度。

可能出现假重复的问题:扩大化科学问题

调查东岗、定远、兴隆山草地森林农田的差异——从三个地点间的差异扩大到全球草地农田森林的差异

线性模型(Linear Models)

交互效应、模型筛选

y=ax+b

两组数据可以T检验t.test()

也可以用线性模型回归(regression lm)实现同样的结果   lm(Height~Gender,data=size)

ANOVA  自变量分组

Linear model  无组可分

线性回归时,也可以通过ANOVA检验误差平方和、总平方和、回归平方和    回归平方和占总平方和的比例,得出R2

通过X2和X1斜率   比较两个变量是否有交互效应

存在交互——即X1影响Y取决于X2的情况    

三种类型,命名为A、B、C。   命名为123,带有量纲,可以比较加减(×)

两组数据   因子型变量   0和1 是无量纲的数据,相除相乘无意义,可以使用

R里面数据读入时,必须把数值型变量转换为因子型变量

Y表示人的身高,a表示刚出生时的身高,b1男性每年长多少厘米,ei误差项

女孩  (1)+0岁时截距的差异b2+斜率的差异b3(X.1)=(a+b2)+(b1+b3)X+ei

b2大小表征0岁是男女生身高的差异,b3男女生长斜率差异

通过b3检验这两者之间存在的差异,是否显著       显著差异,有交互效应    

b3显著大于/小于0,二者斜率不同,存在交互效应



举例

 温度影响与游泳速度的差异

本身两种鱼因身体结构的差异,就存在游泳速度差异,两种鱼游泳速度随温度增长也不同

 D列,两种鱼,一种为0,一种为1

检验三个假设

H01:检验b1=0,第一种鱼游泳速度是否会随着水温变化

H02:检验b2=0,两种鱼在某一给定温度下游泳速度是否差异

H03:检验b3=0,两种鱼随温度变化,游泳速度变化是否有差异

参数估计时的均值  估计值Estimate         ±(95%置信区间)1.96×SE=0,其P值就是0.05

22.4405±1.96×3.4841,离0很大,即P值很大1.55e-05

估计值与实际值之间的标准误Std.Error(SE)

 t value  P值

第一行  Intercept(截距)  a=22.440      第一种鱼的0°游泳速度,即截距

第二行 Temperature            b1=1.015     第一种鱼游泳速度随温度变化,斜率b1

第三行 Species Trout           b2=18.356   第二种鱼与第一种鱼的截距差值b2

第四行 Species Trout :Temperature   b3=1.626   第二种鱼与第一种鱼的斜率差值b3,P值为2.68e-05,即两种鱼游泳速度随温度变化的差异显著

线性回归 回归平方和和误差平方和那个占比更大,

R2 统计得出,表征看回归平方和/误差平方和是否显著

显示出截距和斜率存在多大的差距,斜率的差异b3是否显著

 e.g., 氮磷存在显著交互作用

氮影响生物量,磷影响生物量,同时氮和磷交互着影响生物量)——氮对生物量的影响依赖于是否添加磷

对于交互效应,符合边界性原则——用到交互效应,必须先说明主效应

提问:氮处理,磷处理,氮磷交互处理建立SEM模型

piecewisedSEM包(分段结构方程模型)—multigroup函数

multigroup(
  modelList,
  group,
  standardize = "scale",
  standardize.type = "latent.linear",
  test.type = "III"
)

 先固定磷的水平,有无磷

1.有磷,氮对因子的SEM

2.无磷,氮对因子的SEM

固定磷来分组检验   不要把N/P/NP放在一个SEM,不同情况建立SEM,路径更容易看出是否有交互差异。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值