利用Excel和jupyter编程完成线性回归

最新推荐文章于 2023-12-19 10:43:38 发布

tc江南

最新推荐文章于 2023-12-19 10:43:38 发布

阅读量1k

点赞数

文章标签： excel jupyter 线性回归

本文链接：https://blog.csdn.net/m0_70557820/article/details/129584132

版权

文章目录

1、利用excel中数据分析功能做线性回归练习。
2、jupyter编程（不借助第三方库），用最小二乘法
3、用jupyter编程，借助skleran
4、总结

1、利用excel中数据分析功能做线性回归练习。

1、打开excel，添加数据分析工具。

点击开始->更多->选项
在这里插入图片描述
点击加载项->分析工具库->转到

然后，点击分析工具库，再点确定

然后，这里就会出现分析栏。

2、数据分析

首先点击数据分析
在这里插入图片描述
点击回归->确定

选择身高作X，体重作Y，再选择20个数据，选择合适的输出区域，并且给线性拟合图打勾，点击确定。

输出下图
加粗样式
再双击体重，设置最大，最小值以及间隔

最后成果，如下
在这里插入图片描述
然后，点击+号，点击趋势线

点击Y，点击确定

结果如下

双击实线，设置显示方程和R
最后效果如下

3、以上方式再选中更多数据

选中200个数据
最后结果如下：
在这里插入图片描述

选中2000个数据
最后结果如下：

在这里插入图片描述

2、jupyter编程（不借助第三方库），用最小二乘法

1、打开jupyter,新建文件

在这里插入图片描述
重命名文件

再将所需要的文件导入jupyter中，

点击该文件，确定

完成后，jupyter中就有了该文件

就不用在程序里使用数据文件时加入路径。

2、输入代码

import pandas as pd
import numpy as np
import math
#准备数据
p=pd.read_excel('weights_heights.xls','weights_heights')
#读取20行数据
p1=p.head(20)
x=p1["Height"]
y=p1["Weight"]
# 平均值
x_mean = np.mean(x)
y_mean = np.mean(y)
#x（或y）列的总数（即n）
xsize = x.size
zi=((x-x_mean)*(y-y_mean)).sum()
mu=((x-x_mean)*(x-x_mean)).sum()
n=((y-y_mean)*(y-y_mean)).sum()
# 参数a b
a = zi / mu
b = y_mean - a * x_mean
#相关系数R的平方
m=((zi/math.sqrt(mu*n))**2)
# 这里对参数保留4位有效数字
a = np.around(a,decimals=4)
b = np.around(b,decimals=4)
m = np.around(m,decimals=4)
print(f'回归线方程:y = {a}x +({b})') 
print(f'相关回归系数为{m}')
#借助第三方库skleran画出拟合曲线
y1 = a*x + b
plt.scatter(x,y)
plt.plot(x,y1,c='r')

点击运行。

3、查看结果

结果如下
在这里插入图片描述
同理，200行，和2000行也一样

20改为200或2000。
结果如下
200：

2000：

3、用jupyter编程，借助skleran

1、如上，先建一个新文件，并重命名。

2、输入代码

# 导入所需的模块
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from sklearn.linear_model import LinearRegression

p=pd.read_excel('weights_heights.xls','weights_heights')
#读取数据行数
p1=p.head(20)
x=p1["Height"]
y=p1["Weight"]
# 数据处理
# sklearn 拟合输入输出一般都是二维数组，这里将一维转换为二维。
y = np.array(y).reshape(-1, 1)
x = np.array(x).reshape(-1, 1)
# 拟合
reg = LinearRegression()
reg.fit(x,y)
a = reg.coef_[0][0]     # 系数
b = reg.intercept_[0]   # 截距
print('拟合的方程为：Y = %.4fX + (%.4f)' % (a, b))
c=reg.score(x,y)    # 相关系数
print(f'相关回归系数为%.4f'%c)

# 可视化
prediction = reg.predict(y)                # 根据高度，按照拟合的曲线预测温度值
plt.xlabel('身高')
plt.ylabel('体重')
plt.scatter(x,y)
y1 = a*x + b
plt.plot(x,y1,c='r')

点击运行。

3、查看结果

结果如下
在这里插入图片描述
同理，200行和2000行
200行：

2000行

4、总结

Excel和jupyter解决线性回归问题得出的结果大致相同。Excel只需选中数据，通过其内部设计好的算法得出相关数据。操作相对简单。但自己编程不用sklearn库的话，要自己设计算法来得到相关系数，斜率和截距，并以此数据来绘图。因为sklearn库有提供相关的函数，所以只需要调用函数即能得到输出值。

tc江南

关注

0
点赞
踩
16

收藏

觉得还不错? 一键收藏
0
评论
利用Excel和jupyter编程完成线性回归

Excel和jupyter解决线性回归问题得出的结果大致相同。Excel只需选中数据，通过其内部设计好的算法得出相关数据。操作相对简单。但自己编程不用sklearn库的话，要自己设计算法来得到相关系数，斜率和截距，并以此数据来绘图。因为sklearn库有提供相关的函数，所以只需要调用函数即能得到输出值。
复制链接

扫一扫