我对Statsmodels Mixedlm的输出感到有点困惑,我希望有人可以解释一下.
我有一个大型的单户住宅数据集,包括每个房产的前两个销售价格/销售日期.我对整个数据集进行了地理编码,并获取了每个属性的高程.我试图了解不同城市之间提升与房地产价格升值之间关系的变化方式.
我使用statsmodels混合线性模型来回归价格升值的高程,保持其他一些因素不变,以城市作为我的团体类别.
md = smf.mixedlm('price_relative_ind~Elevation+YearBuilt+Sale_Amount_1+LivingSqFt',data=Miami_SF,groups=Miami_SF['City'])
mdf = md.fit()
mdf.random_effects
输入mdf.random_effects将返回系数列表.我能否将此列表解释为每个城市的斜率(即,与销售价格升值相关的个别回归系数)?或者这些结果是每个城市的拦截?
解决方法:
我目前正试图在MixedLM中了解随机效应.看看the docs,似乎只使用groups参数,没有exog_re或re_formula只会为每个组添加一个随机拦截.来自文档的一个例子:
# A basic mixed model with fixed effects for the columns of exog and a random intercept for each distinct value of group:
model = sm.MixedLM(endog, exog, groups)
result = model.fit()
因此,在这种情况下,您会期望random_effects方法返回城市的截距,而不是系数/斜率.
要为您的其他功能添加随机斜率
本文介绍了如何使用Python的Statsmodels库进行混合线性模型(Mixedlm)分析,以理解不同城市中海拔与房地产价格升值之间的关系。通过建立模型并解释`random_effects`的结果,指出在默认情况下,`groups`参数只会添加随机截距,而非随机斜率。要添加随机斜率,需要使用`re_formula`。文中提供了相关资源和代码示例以帮助理解和应用混合线性模型。
最低0.47元/天 解锁文章
560

被折叠的 条评论
为什么被折叠?



