python做面板数据分析_Python线性模型在稀疏数据上的面板数据回归

最新推荐文章于 2023-03-30 00:43:08 发布

Golg

最新推荐文章于 2023-03-30 00:43:08 发布

阅读量1k

点赞数

文章标签： python做面板数据分析

本文链接：https://blog.csdn.net/weixin_29168675/article/details/112833377

版权

我试图对面板数据进行多元回归分析。我需要用不同的因变量运行成百上千的回归，并将所有结果存储在一个数据结构中，以便以后查看。我使用Python并使用statsmodels运行回归，但不使用公式，因为它们使依赖变量更难循环。我正在尝试使用linearmodels包调整固定效果，但失败了。在

似乎我的问题是我的数据集非常稀疏；它包含很多“NaN”。在我看来，pandas包含一个数据结构data.set_索引('time'，'entity')，我可以用它来运行面板数据回归，控制固定效果。但是当我通过这个函数发送我的数据集时，它似乎会自动删除整个数据集中带有“NaN”的每一行，这会删除每一行，程序就会退出。在

当使用statsmodels的回归时，我可以删除回归函数OLS(y，x，missing='drop')中缺少的值。有没有办法在控制固定效果的同时做到这一点？或者用其他方法控制Python中非常稀疏的数据集中的固定效果？还是我错过了什么？在

例如，假设数据集是一个数据帧：dataSet = {'entity': ['northpole', 'northpole', 'northpole', 'southpole', southpole', 'southpole'], 'time': [2014, 2015, 2016, 2014, 2015, 2016], 'col1': [1, 3, 5, 3, 1, -1], 'col2' : [1, 4, 7, 4, 1, -2], 'col3': [NaN, NaN, 4, 5, 3, 0], 'col4': [4, 5, NaN, NaN, NaN, NaN]}

dataSetNew = dataSet.set_index('entity', 'time'])

variable = PanelOLS(dataSetNew.col1, dataSetNew.col2, entity_effects = True, time_effects = True)

程序没有完成数据集的计算。它会显示以下错误消息：

^{pr2}$

之后就退出了。在

Golg

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫