1.statsmodels----OLS回归_smf.ols-CSDN博客

本文链接：https://blog.csdn.net/qq_42830971/article/details/108895229

模型等用法去这里
https://www.w3cschool.cn/doc_statsmodels/dict.html

快速入门

import numpy as np
import statsmodels.api as sm
import statsmodels.formula.api as smf   #导入模块

dat = sm.datasets.get_rdataset("Guerry","HistData").data  #加载官方数据
dat.head()

result = smf.ols('Lottery ~ Literacy + np.log(Pop1831)',data = dat).fit()   #ols最小二乘回归
print(result.summary())

在这里插入图片描述
以上为示例

学过计量经济学或者多元统计的朋友应该都接触过最小二乘的原理，即求解一组参数使得预测值与实际值的总误差最小。
在多元统计中以矩阵的形式来表述多元方程。因此

$\beta = Y$

为了可以保证方阵可以化简，我们将上式化为
$X^TX\beta = X^TY$
进而可以：
$\beta = (X^TX)^{-1}X^TY$

计算机中能够快速的将数据转化为矩阵：
y,X = dmatrices(‘Lottery ~ Literacy + Wealth + Region’,data = dat,return_type = ‘dataframe’)

C为Categorical variables缩写，即分类变量