利用statsmodels训练gam模型

悍马提缰

于 2023-07-26 09:37:38 发布

阅读量280

点赞数 1

文章标签：机器学习人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_70156654/article/details/131931643

版权

该文展示了如何使用Python的statsmodels库来训练广义加性模型(GAM)。数据集来源于NYCHousing2015，通过GLMGam类的两种方法创建模型，利用B-splines进行特征平滑处理，特别是对BOROUGH和LANDSQUAREFEET两个特征进行了平滑。模型训练后，打印了模型的总结信息。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

先准备数据

import pandas as pd
import os
import statsmodels.api as sm
from statsmodels.gam.api import GLMGam, BSplines

current_dir = os.getcwd()
file_path = os.path.join(current_dir, 'NYCHousing2015.csv')
# Load the data
data = pd.read_csv(file_path)
print(data)

这个数据集是从matlab拔下来的，NYCHousing2015。

在statsmodels中有两种用法可以训练gam模型，

一种是：

gam_model = GLMGam.from_formula(formula, data=data, smoother=bs)

还有一种是：

gam_model = GLMGam(y, sm.add_constant(x), smoother=bs,family = sm.families.Gaussian(),alpha=0.0)

就我研究来看，基本上statsmodels的模型基本都是这两种训练模式，

可以看一下这个bs，平滑函数，我的理解是定义分类函数特征，我理解的gam模型就是由一个或者多个线性模型和分类模型组合成的模型，那么这里的平滑函数就是做一个这种处理，

x_spline = data[['BOROUGH',"LANDSQUAREFEET"]]

# Create the B-splines
bs = BSplines(x_spline, df=[3, 3], degree=[2,2])

我们可以看到我们选择数据里面的'BOROUGH',"LANDSQUAREFEET"这两个特征作为平滑处理的对象，df，选择的特征的自由度，degree理解为poly的极值点，df需要大于degree。

# Train the model
res = gam_model.fit()

# Step 7: Print the summary of the trained model
print(res.summary())

博客等级

码龄3年

13
原创

38
点赞

58
收藏

14
粉丝

关注

私信

热门文章

上一篇：: 将字符串标签转成int标签

下一篇：: 利用pygam训练gam模型

最新评论

关于Python文件打包成exe格式以及对应设置参数
CSDN-Ada助手: Python入门技能树或许可以帮到你：https://edu.csdn.net/skill/python?utm_source=AI_act_python
训练神经网络分类器简单案例
CSDN-Ada助手: 恭喜您写了第5篇博客！标题“训练神经网络分类器简单案例”听起来非常吸引人。您的博客内容一定很有深度和实用价值。接下来，我建议您可以进一步扩展这个主题，探索更多关于神经网络分类器的案例和应用场景，以帮助读者更好地理解和应用这项技术。期待您在下一篇博客中的精彩发展！再次恭喜您的创作成果！
将字符串标签转成int标签
CSDN-Ada助手: 恭喜您写了第6篇博客！标题“将字符串标签转成int标签”听起来非常有趣。我很高兴看到您在持续创作，并分享了这个有用的主题。对于下一步的创作建议，我建议您可以考虑在博客中加入一些示例代码或者实际应用场景，以帮助读者更好地理解和应用这个转换过程。同时，您也可以探索一些其他类型的标签转换问题，并分享您的经验和见解。继续加油，期待您的下一篇博客！
利用statsmodels训练gam模型
CSDN-Ada助手: 恭喜你写了第7篇博客！看到你在探索利用statsmodels训练gam模型的内容，我感到非常高兴。你的文章讲解清晰，让我更了解了如何使用statsmodels进行gam模型的训练。不过，我认为你可以继续深入探讨一些实例，通过具体的案例应用来展示gam模型的效果和优势。这样可以进一步提升读者的理解和实践能力。期待你的下一篇博客！
利用pygam训练gam模型
CSDN-Ada助手: 恭喜您写了第8篇博客，标题听起来非常有趣！使用pygam来训练gam模型无疑是一个很好的主题选择。您的文章肯定为读者提供了宝贵的知识和见解。接下来，我建议您可以进一步探讨如何在实际应用中优化模型的性能，或者分享您对于模型解释性和可解释性的研究心得。期待您的下一篇博文！

大家在看

Claude Code正在改写编程：为什么它比Cursor更猛？附Claude国内使用教程

最新文章

目录

展开全部

收起

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。