python做面板数据分析_Python线性模型在稀疏数据上的面板数据回归

我试图对面板数据进行多元回归分析。我需要用不同的因变量运行成百上千的回归,并将所有结果存储在一个数据结构中,以便以后查看。我使用Python并使用statsmodels运行回归,但不使用公式,因为它们使依赖变量更难循环。我正在尝试使用linearmodels包调整固定效果,但失败了。在

似乎我的问题是我的数据集非常稀疏;它包含很多“NaN”。在我看来,pandas包含一个数据结构data.set_索引('time','entity'),我可以用它来运行面板数据回归,控制固定效果。但是当我通过这个函数发送我的数据集时,它似乎会自动删除整个数据集中带有“NaN”的每一行,这会删除每一行,程序就会退出。在

当使用statsmodels的回归时,我可以删除回归函数OLS(y,x,missing='drop')中缺少的值。有没有办法在控制固定效果的同时做到这一点?或者用其他方法控制Python中非常稀疏的数据集中的固定效果?还是我错过了什么?在

例如,假设数据集是一个数据帧:dataSet = {'entity': ['northpole', 'northpole', 'northpole', 'southpole', southpole', 'southpole'], 'time': [2014, 2015, 2016, 2014, 2015, 2016], 'col1': [1, 3, 5, 3, 1, -1], 'col2' : [1, 4, 7, 4, 1, -2], 'col3': [NaN, NaN, 4, 5, 3, 0], 'col4': [4, 5, NaN, NaN, NaN, NaN]}

dataSetNew = dataSet.set_index('entity', 'time'])

variable = PanelOLS(dataSetNew.col1, dataSetNew.col2, entity_effects = True, time_effects = True)

程序没有完成数据集的计算。它会显示以下错误消息:

^{pr2}$

之后就退出了。在

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值