Python 之多元线性回归分析

本文介绍了使用Python进行多元线性回归分析,包括数据预处理、使用pandas库,以及线性回归库如PanelOLS、LinearRegression和OLS。在固定效应的添加过程中,提到了创建二级MultiIndex的重要性,以及在开启固定效应时可能出现的列丢失问题,特别是当实体索引与行业控制相关时。同时,文章讨论了年度控制和行业控制的添加方法,并指出在某些情况下可能需要避免重复控制。
摘要由CSDN通过智能技术生成

Python 之多元线性回归分析

数据预处理

使用pandas进行数据预处理

本文使用的数据处理工具为pandas,其提供了对excel文件,csv文件的高效处理,操作简单。
‘’’

def read_excel(path, save=False):
    # 读取excel 文件
    data = pd.read_excel(path, index_col=[])
    
    # 读取csv 文件
    data = pd.read_csv(path, index_col=[])
    
    
    # 获取特定的columns
    data = data[['c1', 'c2', 'c3', ...,'cn']]
    
    # 将获取的文件保存为excel 格式,或者其他的格式csv等。
    if save:
        data.to_excel("d.xlsx", index=False)
    
    # 将文件保存为csv格式的其他方法:
    numpy.savetxt(path, data, delimiter=',', header="x1", fmt='%f', comments='')
    
    # 丢弃选取的列的方法,drop
    data = data.drop(columns = ['c1','c2','c3']
    
    # 添加一列的方法 insert (index, new_data)
    col_name = data.columns.tolist()  # 获取原始的列
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值