利用Python进行数据分析笔记-pandas建模(statsmodels篇)

跟着教程学习了一段时间数据分析,越学感觉坑越多。于是花了一个星期仔细看了下《利用Python进行数据分析》。写在这里主要是记录下,方便自己查看。

statsmodels简介

statsmodels是一个有很多统计模型的python库,能完成很多统计测试,数据探索以及可视化。它也包含一些经典的统计方法,比如贝叶斯方法和一个机器学习的模型。

statsmodels中的模型包括:

  • 线性模型(linear models),广义线性模型(generalized linear models),鲁棒线性模型(robust linear models)
  • 线性混合效应模型(Linear mixed effects models)
  • 方差分析(ANOVA)方法(Analysis of variance (ANOVA) methods)
  • 时间序列处理(Time series processes)和状态空间模型(state space models)
  • 广义矩估计方法(Generalized method of moments)

接下来我们用一些statsmodels中的工具,并了解如何使用Patsy公式和pandas DataFrame进行建模。

1、估计线性模型

statsmodels中的线性模型大致分为两种:基于数组的(array-based),和基于公式的(formula-based)。调用的模块为:

import statsmodels.api as sm 
import statsmodels.formula.api as smf
为了演示如何使用,我们对一些随机数据生成一个线性模型:
import numpy as np
import pandas as pd
def dnorm(mean, variance, size=1):
    if isinstance(size, int):
        size = size
    return mean + np.sqrt(variance) * np.random.randn(size)

  • 23
    点赞
  • 176
    收藏
    觉得还不错? 一键收藏
  • 5
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 5
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值