python广义矩估计_《利用Python进行数据分析》13章(中二)建模库介绍

本文介绍了Python的statsmodels库,用于统计模型拟合、试验和数据探索。通过示例展示了如何使用statsmodels进行线性模型的估计,包括添加截距、普通最小二乘法,并探讨了时间序列过程的自回归模型。同时,statsmodels还支持广义矩估计等其他统计方法。
摘要由CSDN通过智能技术生成

前文传送门:

13.3 statsmodels介绍

statsmodels是Python进行拟合多种统计模型、进行统计试验和数据探索可视化的库。Statsmodels包含许多经典的统计方法,但没有贝叶斯方法和机器学习模型。

statsmodels包含的模型有:

线性模型,广义线性模型和健壮线性模型

线性混合效应模型

方差(ANOVA)方法分析

时间序列过程和状态空间模型

广义矩估计

下面,我会使用一些基本的statsmodels工具,探索Patsy公式和pandasDataFrame对象如何使用模型接口。

估计线性模型

statsmodels有多种线性回归模型,包括从基本(比如普通最小二乘)到复杂(比如迭代加权最小二乘法)的。

statsmodels的线性模型有两种不同的接口:基于数组,和基于公式。它们可以通过API模块引入:

import statsmodels.api as sm

import statsmodels.formula.api as smf

为了展示它们的使用方法,我们从一些随机数据生成一个线性模型:

def dnorm(mean, variance, size=1):

if isinstance(size, int):

size = size,

return mean + np.sqrt(variance) * np.random.randn(*size)

# For reproducibility

np.random.seed(12345)

N = 100

X = np.c_[dnorm(0, 0.4, size=N),

dnorm(0, 0.6, size=N),

dnorm(0, 0.2, size=N)]

eps = dnorm(0, 0.1, size=N)

beta = [0.1, 0.3, 0.5]

y = np.dot(X, beta) + eps

这里,我使用了“真实”模型和可知参数beta。此时,dnorm可用来生成正太分布数据,带有特定均值和方差。现在有:

In [66]: X[:5]

Out[66]:

array([[-0.1295, -1.2128, 0.5042],

[ 0.3029, -0.4357, -0.2542],

[-0.3285, -0.0253, 0.1384],</

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值