statsmodels.formula数据使用predict（）

最新推荐文章于 2024-02-02 10:57:51 发布

小瓶盖的猪猪侠

最新推荐文章于 2024-02-02 10:57:51 发布

阅读量2.1k

点赞数

本文链接：https://blog.csdn.net/qq_29983883/article/details/116398956

版权

问题专栏收录该内容

6 篇文章 1 订阅

订阅专栏

运行statsmodels.formula.api.ols得到了一些回归结果。下面是一个玩具示例：

import pandas as pd
import numpy as np
import statsmodels.formula.api as smf

example_df = pd.DataFrame(np.random.randn(10, 3))
example_df.columns = ["a", "b", "c"]
fit = smf.ols('a ~ b', example_df).fit()

我想将模型应用于列c，但天真的尝试是行不通的：

fit.predict(example_df["c"])

我得到一个例外：

PatsyError: Error evaluating factor: NameError: name 'b' is not defined
    a ~ b
        ^

我可以做一些粗制滥造的事情，创建一个新的、临时的DataFrame，其中我重命名了感兴趣的列：

example_df2 = pd.DataFrame(example_df["c"])
example_df2.columns = ["b"]
fit.predict(example_df2)

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

小瓶盖的猪猪侠

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

python中的predict_如何在python的statsmodels中使用.predict()函数预测值?

weixin_35724224的博客

02-03

4545

我输入了以下几行代码:# import relevant statistical packagesimport numpy as npimport pandas as pdimport statsmodels.api as smimport pylab as plimport sklearn.linear_model as sklimport sklearn.metrics as metricsf...

Python 第三方模块统计1 statsmodels模块1 简介,回归

weixin_46131409的博客

02-19

3179

一.statsmodels模块官方文档:https://www.statsmodels.org/stable/index.html 二.patsy模块官方文档:https://pypi.org/project/patsy/ 1.概述 (1)简介: patsy是1个用于描述统计模型(尤其是线性模型或具有线性组件的模型)和构建设计矩阵的Python库.其受R/S语言中的公式迷你语言启发并与之兼容 (2)安装: pip install patsy 2.使用 ...

参与评论您还未登录，请先登录后发表或查看评论

python自变量错误_pandas statsmodels中的predict（），添加自变量

weixin_30086969的博客

01-30

1011

我正在用熊猫建立一个多元线性回归模型：import pandas as pdimport statsmodels.api as smclimate = pd.read_csv("climate_change.csv")climate_train = climate.query('Year <= 2006')climate_test = climate.query('Year > 200...

使用Statsmodels进行线性回归与时间序列分析

qq_33578950的博客

04-02

1957

众所周知，线性回归和时间序列分析是数据科学领域中的两个重要技术。在本文中，我们将使用Statsmodels库来进行线性回归和时间序列分析。Statsmodels是Python中的一个强大库，用于拟合统计模型。

教你使用Python Statsmodel进行假设检验和线性回归

最新发布

m0_59236127的博客

02-02

1284

换句话说，它帮助我们确定观察到的两组之间的差异是否可能是偶然的，或者它是否是一个重要的真正差异。我们学习Python必然是为了找到高薪的工作，下面这些面试题是来自阿里、腾讯、字节等一线互联网大厂最新的面试资料，并且有阿里大佬给出了权威的解答，刷完这一套面试资料相信大家都能找到满意的工作。它告诉我们在原假设为真的情况下观察到的结果比我们得到的结果更极端的概率。Python所有方向的技术点做的整理，形成各个领域的知识点汇总，它的用处就在于，你可以按照上面的知识点去找对应的学习资源，保证自己学得较为全面。

statsmodels专栏2——探索关系：Python中的Statsmodels库进阶

theskylife的博客

12-19

1872

在数据分析的旅程中，我们曾一同探索Statsmodels库的基本用法，如何进行简单线性回归分析。然而，现在是时候深入了解更为复杂、多变的数据关系了。本文将引领你进入Statsmodels库的进阶用法，涵盖多元线性回归、Logistic回归以及时间序列分析，让我们更深刻地认识数据背后的关系。

Python学习笔记-StatsModels 统计回归——线性回归

iFlyAI的博客

05-18

6277

python对逻辑回归进行显著性检验_python 数据分析基础 day19－使用statsmodels进行逻辑回归...

weixin_32576389的博客

12-30

2636

今天是读《python数据分析基础》的第19天，读书笔记内容为使用statsmodels进行逻辑回归。以下代码将按数据清洗、训练模型、得出测试集的预测值这三个步骤展示逻辑回归模型的使用。#使用逻辑回归预测客户流失概率import pandas as pdimport numpy as npimport statsmodels.api as sma#导入数据inputCsv='数据路径'churn=...

python如何运用ols,使用OLS回归预测未来值（Python，StatsModels，Pandas）

weixin_42525428的博客

12-04

2262

I'm currently trying to implement a MLR in Python and am not sure how I go about applying the coefficients I've found to future values.import pandas as pdimport statsmodels.formula.api as smimport sta...

利用Python进行数据分析笔记－pandas建模(statsmodels篇)

热门推荐

wuzlun的专栏

05-14

4万+

跟着教程学习了一段时间数据分析，越学感觉坑越多。于是花了一个星期仔细看了下《利用Python进行数据分析》。写在这里主要是记录下，方便自己查看。 statsmodels简介 statsmodels是一个有很多统计模型的python库，能完成很多统计测试，数据探索以及可视化。它也包含一些经典的统计方法，比如贝叶斯方法和一个机器学习的模型。 statsmodels中的模型包括： ...

Python数据分析基础之描述性统计与建模(1)

CCH²¹的博客

02-28

3073

葡萄酒质量数据集葡萄酒质量数据集包括两个文件——红葡萄酒文件和白葡萄酒文件。红葡萄酒文件中包含1599条观测，白葡萄酒文件包含4898条观测。两个文件中都有1个输出变量和11个输入变量。输出变量是酒的质量，是一个从0（低质量）到10（高质量）的评分。输入变量是葡萄酒的物理化学成分和特性，包括非挥发性酸、挥发性酸、柠檬酸、残余糖分、氯化物、游离二氧化硫、总二氧化硫、密度、pH值、硫酸盐和酒精含...

python 中 statsmodels模块的 API接口

chenhepg的博客

03-15

1万+

@创建于：20210315 @修改于：20210315 文章目录1、statsmodels API2、statsmodels.api3、statsmodels.tsa.api4、statsmodels.formula.api5、参考资料 1、statsmodels API statsmodels是Pandas生态系统（ecosystem）下Statistics and Machine Learning下的一个库。主要是偏传统频率学派统计方法，具体有下面三大主题组成。 statsmodels.api：横截面模

statsmodels专栏4——深度解析：Python中的Statsmodels库时间序列分析

theskylife的博客

12-20

2104

时间序列分析在数据科学领域中占据着重要地位，它不仅帮助我们理解数据的趋势和模式，还能够提供对未来趋势的预测。在众多时间序列分析工具中，Python中的Statsmodels库以其强大的功能和灵活性备受青睐。本文将深入探讨Statsmodels库在时间序列分析中的应用，聚焦于移动平均模型（MA）、自回归模型（AR）以及ARIMA模型，带你领略Statsmodels的精妙之处。

1.statsmodels----OLS回归

小蜗Leon的博客

10-01

5515

快速入门库函数导入 import numpy as np import statsmodels.api as sm import statsmodels.formula.api as smf #导入模块加载数据 dat = sm.datasets.get_rdataset("Guerry","HistData").data #加载官方数据 dat.head() 回归函数 result = smf.ols('Lottery ~ Literacy + np.log(Pop1831)',data =

利用 python 进行线性回归

ls13552912394的博客

02-28

3万+

理解什么是线性回归线性回归也被称为最小二乘法回归（Linear Regression, also called Ordinary Least-Squares (OLS) Regression）。它的数学模型是这样的：y = a+ b* x＋e其中，a 被称为常数项或截距；b 被称为模型的回归系数或斜率；e 为误差项。a 和 b 是模型的参数。当然，模型的参数只能从样本数据中估计出来：y'= a' ...

数据驱动分析实践六- 预测销量

weixin_43171270的博客

02-03

2840

数据驱动分析实践六预测销量在本篇文章之前，我们所有的预测模型都是面对客户的，例如流失率、下一个购买日等。现在我们可以看看宏观层面的事情，看看客户级别的问题是如何影响销量的。时序预测是机器学习技术的重要组成部分，例如ARIMA(Autoregressive Integrated Moving Average)、SARIMA(Seasonal Autoregressive Integrated Moving-A

python如何运用ols_使用OLS回归预测未来值（Python，StatsModels，Pandas）

weixin_39594103的博客

12-04

4519

statsmodels笔记

qsefrdwa的博客

11-01

1万+

代码高亮“` python statsmodels 学习 statsmodels.tsa 是statsmodels中用于time series的部分。其中分为stattools，ar_model.AR,arima_model，vector_ar等等。 stattools包含统计方法，如自相关系数，偏自相关系数等等（此处需要再补充） 1.statsmodels.

代码解释# 绘制销售收入与广告支出的散点图 import pandas as pd import seaborn as sns import matplotlib.pyplot as plt from scipy.stats import pearsonr from statsmodels.formula.api import ols plt.rcParams['font.sans-serif'] = ['SimHei'] example1 = pd.read_csv("E:\数学建模学习文件\python学习\可视化处理及图像\对应的表格\example1.csv", encoding='gbk') fig = sns.jointplot(x="广告支出", y="销售收入", data=example1, kind="reg", truncate=True, color="steelblue",height=6,ratio=3,marginal_ticks=1) # fig = sns.regplot(x="广告支出", y="销售收入", data=example1, # fit_reg=1,color="steelblue") # fig.savefig('./图1.jpg', dpi = 200) # 注：seaborn可以绘制95%置信区间图 #计算相关系数与显著性检验 corr, p_value = pearsonr(example1['销售收入'], example1['广告支出']) print(f"二者的相关系数为{corr: .4g}，检验的p值为{p_value: .4g}") model = ols("销售收入~广告支出",data=example1).fit() print(model.summary()) ypred=model.predict(example1['广告支出']) print(ypred)

05-29

这段代码使用了Python中的pandas、seaborn、matplotlib、scipy和statsmodels库来绘制销售收入与广告支出的散点图，并进行相关系数与显著性检验。具体的代码解释如下： 1. 首先导入需要使用的库： ``` import pandas as pd import seaborn as sns import matplotlib.pyplot as plt from scipy.stats import pearsonr from statsmodels.formula.api import ols ``` 2. 读取数据文件example1.csv，并使用seaborn库中的jointplot方法绘制散点图。其中，x和y分别为广告支出和销售收入的列名，kind为图形类型，truncate为是否截断数据，color为散点颜色，height和ratio为图形的高度和宽高比，marginal_ticks为是否显示坐标轴刻度。 ``` example1 = pd.read_csv("E:\数学建模学习文件\python学习\可视化处理及图像\对应的表格\example1.csv", encoding='gbk') fig = sns.jointplot(x="广告支出", y="销售收入", data=example1, kind="reg", truncate=True, color="steelblue",height=6,ratio=3,marginal_ticks=1) ``` 3. 计算相关系数和显著性检验，并输出结果。其中，pearsonr方法计算相关系数，返回值为相关系数和p值。 ``` corr, p_value = pearsonr(example1['销售收入'], example1['广告支出']) print(f"二者的相关系数为{corr: .4g}，检验的p值为{p_value: .4g}") ``` 4. 使用statsmodels库中的ols方法进行回归分析，并输出回归结果。其中，"销售收入~广告支出"表示使用广告支出来预测销售收入。 ``` model = ols("销售收入~广告支出",data=example1).fit() print(model.summary()) ``` 5. 预测销售收入，并输出结果。 ``` ypred=model.predict(example1['广告支出']) print(ypred) ```