利用statsmodels训练gam模型

先准备数据

import pandas as pd
import os
import statsmodels.api as sm
from statsmodels.gam.api import GLMGam, BSplines

current_dir = os.getcwd()
file_path = os.path.join(current_dir, 'NYCHousing2015.csv')
# Load the data
data = pd.read_csv(file_path)
print(data)

 这个数据集是从matlab拔下来的,NYCHousing2015。

在statsmodels中有两种用法可以训练gam模型,

一种是:

gam_model = GLMGam.from_formula(formula, data=data, smoother=bs)

还有一种是:

gam_model = GLMGam(y, sm.add_constant(x), smoother=bs,family = sm.families.Gaussian(),alpha=0.0)

就我研究来看,基本上statsmodels的模型基本都是这两种训练模式,

可以看一下这个bs,平滑函数,我的理解是定义分类函数特征,我理解的gam模型就是由一个或者多个线性模型和分类模型组合成的模型,那么这里的平滑函数就是做一个这种处理,

x_spline = data[['BOROUGH',"LANDSQUAREFEET"]]

# Create the B-splines
bs = BSplines(x_spline, df=[3, 3], degree=[2,2])

我们可以看到我们选择数据里面的'BOROUGH',"LANDSQUAREFEET"这两个特征作为平滑处理的对象,df,选择的特征的自由度,degree理解为poly的极值点,df需要大于degree。

# Train the model
res = gam_model.fit()

# Step 7: Print the summary of the trained model
print(res.summary())

 

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值