文章目录
13.2 Creating Model Descriptions with Patsy(利用Patsy创建模型描述)
Patsy
是一个python
库,用于描述统计模型(尤其是线性模型),方法是通过一个叫做公式语法(formula syntax
)的字符串来描述。这种公式语法的灵感来源于R和S语言中的公式语法。
Patsy
的公式是有特殊格式的字符串,像下面这样:
y ~ x0 + x1
这种a + b
的语法并不代表将a和b相加,而是代表为模型创建的设计矩阵的术语(terms in the design matrix
)。patsy.dmatrices
函数,取一个公式字符串和一个数据集(可以使DataFrame
或dict
),然后为线性模型产生设计矩阵:
import