matlab fitglm用法,glm和LogitModelFit之间的区别

博客探讨了在估计三个参数时遇到的问题,指出由于数据组的大小,参数估计的标准误差非常高,导致估计值不稳定。文章通过R语言的dplyr库进行数据分组和计算,并与Wolfram的结果进行了比较,发现尽管两者预测相似,但参数估计的不稳定性仍然存在。此外,解释了因x2取值差异导致的模型中参数关系的现象。
摘要由CSDN通过智能技术生成

你实际上有4组,你试图估计3个参数:

library(dplyr)

df %>% group_by(x1, x2) %>% summarise(n = n(), y = mean(y))

从巨大的标准误差中可以看出,参数估计值并不稳定. wolfram的标准误差也应该非常大(如果给出的话).

第二,wolfram,似乎使用不同的引用组,为x1:

> df$x1

> m

> summary(m)

Call:

glm(formula = y ~ x1 + x2, family = binomial(), data = df, control = list(maxit = 100))

Deviance Residuals:

1 2 3 4 5 6

-0.00008 0.00008 -1.17741 1.17741 1.17741 -1.17741

Coefficients:

Estimate Std. Error z value Pr(>|z|)

(Intercept) -19.566 7604.236 -0.003 0.998

x1a -19.566 7604.236 -0.003 0.998

x2 9.783 3802.118 0.003 0.998

(Dispersion parameter for binomial family taken to be 1)

Null deviance: 8.3178 on 5 degrees of freedom

Residual deviance: 5.5452 on 3 degrees of freedom

AIC: 11.545

Number of Fisher Scoring iterations: 18

这更接近于wolfram的结果(这实际上和你找到的模型相同;我只选择另一个参考组).

两种模型(glm和wolfram)的预测几乎相同.实际上,前两个参数非常小的任何模型(最佳模型将是-Inf)而第三个参数等于前两个参数的一半(9.783 * 2 = 19.566)将得到几乎相同的结果.

因子2源于x2取值2和4的事实,它们相差2.

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值