初识线性回归(Excel-Python实现)

一、用excel中数据分析功能做线性回归练习

1.用excel打开下载的身高体重表格。
在这里插入图片描述
2.选取20个数据做线性分析得到
在这里插入图片描述
3.选取200个数据做线性分析得到
在这里插入图片描述
4.选取2000个数据的线性分析
在这里插入图片描述
5.当数据达到20000时的回归方程以及相关系数分别为
y= 3.071x - 81.691 R2 = 0.2513
在这里插入图片描述

二、用jupyter编程(不借助第三方库),用最小二乘法,重做第1题;

1.打开jupyter并且进入编程页面

在这里插入图片描述

2.使用二十组数据进行线性分析

二十组数据代码

import pandas as pd
import numpy as np
import math
#准备数据
p=pd.read_excel('C:\\Users\\86155\\Downloads\\weights_heights
(身高-体重数据集).xls','weights_heights')
#读取20行数据
p1=p.head(20)
x=p1["Height"]
y=p1["Weight"]
# 平均值
x_mean = np.mean(x)
y_mean = np.mean(y)
#x(或y)列的总数(即n)
xsize = x.size
zi=((x-x_mean)*(y-y_mean)).sum()
mu=((x-x_mean)*(x-x_mean)).sum()
n=((y-y_mean)*(y-y_mean)).sum()
# 参数a b
a = zi / mu
b = y_mean - a * x_mean
#相关系数R的平方
m=((zi/math.sqrt(mu*n))**2)
# 这里对参数保留4位有效数字
a = np.around(a,decimals=4)
b = np.around(b,decimals=4)
m = np.around(m,decimals=4)
print(f'回归线方程:y = {a}x +({b})') 
print(f'相关回归系数为{m}')
#借助第三方库skleran画出拟合曲线
y1 = a*x + b
plt.scatter(x,y)
plt.plot(x,y1,c='r')

运行程序得到回归方程,相关系数和相应的回归曲线。
在这里插入图片描述

3.使用200,2000,20000组数据进行分析

200
首先将代码中的20组数据改为200,重新运行,得到
在这里插入图片描述

2000
在这里插入图片描述
20000
在这里插入图片描述

三、借助skleran库完成

skleran代码

import pandas as pd
import numpy as np
import math
#准备数据
p=pd.read_excel('C:\\Users\\86155\\Downloads\\weights_heights(身高-体重数据集).xls','weights_heights')
#读取20行数据
p1=p.head(20000)
x=p1["Height"]
y=p1["Weight"]
# 平均值
x_mean = np.mean(x)
y_mean = np.mean(y)
#x(或y)列的总数(即n)
xsize = x.size
zi=((x-x_mean)*(y-y_mean)).sum()
mu=((x-x_mean)*(x-x_mean)).sum()
n=((y-y_mean)*(y-y_mean)).sum()
# 参数a b
a = zi / mu
b = y_mean - a * x_mean
#相关系数R的平方
m=((zi/math.sqrt(mu*n))**2)
# 这里对参数保留4位有效数字
a = np.around(a,decimals=4)
b = np.around(b,decimals=4)
m = np.around(m,decimals=4)
print(f'回归线方程:y = {a}x +({b})') 
print(f'相关回归系数为{m}')
#借助第三方库skleran画出拟合曲线
y1 = a*x + b
plt.scatter(x,y)
plt.plot(x,y1,c='r')
  1. 20组数据
    在这里插入图片描述

  2. 200组数据
    在这里插入图片描述

  3. 2000组数据

在这里插入图片描述

  1. 20000组数据
    在这里插入图片描述

总结

此次实验使用了三种不同的方法对同一个数据表格进行了线性回归分析,得到的图像以及线性方程大致相同,但是用Excel实现速度以及工作量显然是最快的,的到达结果也最为直观,而是用另外两种方法则能够有助于我们理解线性回归的底层逻辑,使得我们的理解更加深刻。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值