浅谈简单线性回归(Simple linear regression)part2ANOVA

浅谈简单线性回归(Simple linear regression)part2ANOVA

ANOVA(方差分析(Analysis of Variance,简称ANOVA))
目的:用于表达我们的模型有多拟合数据
就是一张表
在这里插入图片描述

关于这类表,有个推论:TSS = SSE + RSS
其中,回归平方和:ESS,残差平方和:RSS,总体平方和:TSS。
即总体平方和=回归平方和+误差平方和(总体=预测+误差)

参数说明:

(1) 实验条件,即不同的处理造成的差异,称为组间差异。用变量在各组的均值与总均值之偏差平方和的总和表示,记作SSb,组间自由度dfb。
(2) 随机误差,如测量误差造成的差异或个体间的差异,称为组内差异,用变量在各组的均值与该组内变量值之偏差平方和的总和表示, 记作SSw,组内自由度dfw。
总偏差平方和 SSt = SSb + SSw。
组内SSw、组间SSb除以各自的自由度(组内dfw =n-m,组间dfb=m-1,其中n为样本总数,m为组数),得到其均方MSw和MSb,一种情况是处理没有作用,即各组样本均来自同一总体,MSb/MSw≈1。另一种情况是处理确实有作用,组间均方是由于误差与不同处理共同导致的结果,即各样本来自不同总体。那么,MSb>>MSw(远远大于)。
MSb/MSw比值构成F分布。用F值与其临界值比较,推断各样本是否来自相同的总体 。

R**2=残差平方和/总体平方和→用于表示模型的拟合度,数值越接近1代表得到的回归方程越好或越适合(模型拟合越好)
在这里插入图片描述

SSR即RSS,SST即TSS,其他同理

在Python中,可以使用`scikit-learn`库来导入和使用线性回归模型`LinearRegression`。以下是使用`LinearRegression`建立基于工龄与平均工资数据集的线性回归模型并进行训练的步骤: 1. 首先,需要安装并导入`scikit-learn`库中的`LinearRegression`类,以及用于模型训练的`train_test_split`函数和其他可能需要的数据处理工具。 2. 准备数据集,通常这个数据集会包含两列数据:一列为工龄,另一列为平均工资。 3. 接着,将数据集分成训练集和测试集。虽然这里只提到了训练模型,但是在实际操作中,划分数据集是为了评估模型的泛化能力。 4. 创建`LinearRegression`对象,并使用训练集数据来拟合(fit)模型。 5. 训练完成后,可以使用训练好的模型来预测新的数据,或者评估模型的性能。 下面是一个简化的代码示例来演示上述步骤: ```python # 导入必要的库 from sklearn.linear_model import LinearRegression from sklearn.model_selection import train_test_split # 假设有一个数据集data,其中包含了工龄和平均工资的信息 # data = ... # 这里data是一个二维数组,第一列是工龄,第二列是平均工资 # 将数据集分为工龄和工资两部分 X = data[:, 0].reshape(-1, 1) # 特征(工龄) y = data[:, 1] # 目标变量(平均工资) # 划分训练集和测试集 X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42) # 创建线性回归模型对象 linear_model = LinearRegression() # 训练模型 linear_model.fit(X_train, y_train) # 训练完成后,模型已经建立并且可以使用 # 如果想要预测新的数据,可以使用linear_model.predict(new_data)来进行 ```
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

丰。。

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值