线性回归(regression)与F-test


考完试了,来把线性回归写写完,前面写完了六个assumption, 再加以前面Hypothesis test的内容就差不多可以表现出一般的线性回归了。

simple regression

单元的线性回归简单的说就是检验两个变量的关系,详细一点就是在用最小二乘法拟合之后对拟合的斜率做一次Hypothesis test,就得到结论了,想知道更多信息可以把p-value搞出来看一看。这与Hypothesis test对单一变量的统计是一样的,只不过这里换成了slope。

multiply regression

但现实中更有意义的往往是多元变量的处理,可以这样想,你对于单元变量,怎么回归都能做出点关系来,因为你的假设或多或少还是和因变量相关的,但是得出来的线性回归实际上价值并不高,第一是观测数据是内生变量是有bias的,也就是说可能是别的变量通过影响它来影响结果,这就是很迷惑的东西,基本就没有价值了。
那怎么办,我们总得用观测数据,不可能做一个研究就去搞千百次实验。这时候就用到了一个初中生就知道的东西,控制变量法,初中的时候我们就学到过,用控制单一变量才能得出有意义的结论。这里在他的基础上扩张。举个例子,怎么研究学历对你将来收入的影响。我们首先要列出影响的它因子(这里只可能是假设),就比如所有影响的因子只有父母收入和你本身学历,考虑其他变量没有直接影响(其实是可以通过R判断还有没有其他重要的因子)。这时候就得控制变量了。 先将这三个变量与未来收入做一个线性回归,可以得到SSE等数据,然后再将父母收入这两个变量做一个线性回归。那么两个回归一起看应该就可以得到结论了。
怎么得到呢?数学模型呗。其实单元变量线性回归就是特殊的一种,以上对照可以看成两种线性模型,单元中不受变量影响的叫unrestricted version,受影响的叫restricted version。然后带入
F = S S E R − S S E U / ( p U − p R ) S S E U / ( n − p u ) F = \frac{SSE_{R}-SSE_{U}/(p_{U}-p_{R})}{SSE_{U}/(n-p_{u})} F=SSEU/(npu)SSERSSEU/(pUpR)
公式怎么来的,Ftest 本质就是检验两个独立变量的关系,同样有Ftable可以查 F ( α ; q , n − k − 1 ) F(\alpha;q,n-k-1) F(α;q,nk1)的值,上述F公式实际就是它的变形。

结语

感觉这篇写的不好,线性回归是个应用很大模型很大的概念,相关数学公式都需要一定时间去了解,但个人认为更为重要的是它本身做的是件什么事情。

  • 1
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
好的,下面我将为您介绍一个经典的机器学习案例--波士顿房价预测,使用的是线性回归模型。 首先,我们需要导入相关的库和数据集。可以通过以下代码实现: ```python import numpy as np import pandas as pd from sklearn.datasets import load_boston boston = load_boston() df = pd.DataFrame(boston.data, columns = boston.feature_names) df['Price'] = boston.target ``` 接下来,我们需要对数据集进行预处理和划分,以便于训练和测试模型。可以通过以下代码实现: ```python X = df.iloc[:, :-1].values y = df.iloc[:, -1].values from sklearn.model_selection import train_test_split X_train, X_test, y_train, y_test = train_test_split(X, y, test_size = 0.2, random_state = 0) from sklearn.preprocessing import StandardScaler sc = StandardScaler() X_train = sc.fit_transform(X_train) X_test = sc.transform(X_test) ``` 接着,我们可以使用线性回归模型进行训练和预测。可以通过以下代码实现: ```python from sklearn.linear_model import LinearRegression regressor = LinearRegression() regressor.fit(X_train, y_train) y_pred = regressor.predict(X_test) ``` 最后,我们可以使用评估指标来评价模型的表现。可以通过以下代码实现: ```python from sklearn.metrics import r2_score r2_score(y_test, y_pred) ``` 这里使用了平均绝对误差(MAE)、均方误差(MSE)和决定系数(R2)三个评估指标。常见的评估指标还包括均方根误差(RMSE)和平均绝对百分比误差(MAPE)等。 以上就是一个简单的线性回归案例--波斯顿房价预测的实现过程,希望对您有所帮助。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值