双因素方差分析_Python统计分析|有交互双因素方差分析

本文探讨如何利用Python的statsmodels库进行双因素方差分析,对比高峰期和低峰期在路段1和路段2的差异,并验证结果与Excel的一致性。
摘要由CSDN通过智能技术生成
     在无交互作用的双因素方差分析中,行因素和列因素对因变量的影响是相互独立的。但是如果两个因素搭配在一起对因变量的影响会形成一个新的效应,就需要考虑交互作用对因变量的影响, 这就是有交互作用的双因素方差分析。 书中的例子:

216a4ebb9847aad17dc719f92aa804a2.png

    行变量有2个水平,即高峰期和低峰期;列变量有2个水平,即路段1和路段2;行变量的每一个水平有5行数据;列变量的每一个水平有2列数据,如下图:

57027e00ea38d63a3970d0231a1afffd.png

excel输出结果

156503b8a078b9a408b9d6d24004a0e0.png

使用statsmedols进行双因素方差分析

import pandas as pdfrom statsmodels.formula.api import olsfrom statsmodels.stats.anova import anova_lmroad_data = {'value':[26,19,24,20,27,23,25,22,25,21,20,18,17,17,22,13,21,16,17,12],            'level_0':['r1','r2','r1','r2','r1','r2','r1','r2','r1','r2','r1','r2','r1','r2',                      'r1','r2','r1','r2','r1','r2'],            'level_1':['H','H','H','H','H','H','H','H','H','H',                      'L','L','L','L','L','L','L','L','L','L']}df = pd.DataFrame(road_data)model = ols('value ~ C(level_0)+C(level_1)+C(level_0):C(level_1)', df).fit()anova_lm(model)                       df  sum_sq  mean_sq     F         PR(>F)C(level_0)             1.0  92.45   92.45   23.405063  0.000182C(level_1)             1.0  174.05  174.05  44.063291  0.000006C(level_0):C(level_1)  1.0   0.05    0.05   0.012658   0.911819Residual               16.0  63.20   3.95    NaN       NaN

计算结果与excel输出一致!

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值