@基于python实现的基本线性回归(高中数学版)
由于毕设的原因,在这里做一些笔记,主要是记录一下pandas和list以及基本计算求得线性回归的系数
数据集来源
数据集是来自于科赛的数据,附下载链接(需要一个github账号才能下载)
https://www.kesci.com/home/dataset/59e715b76d213335f38d4507
下载好了以后的数据集就是这样的
我这次采用的是车辆的数据集进行基本的计算,车辆的速度与行驶距离之间的关系是否能用基本的线性回归方式进行拟合呢?那么我们首先要求得之间的相关系数才能下结论,但是最起码我掌握了一种基本的预测方法。
一些基本知识
从下图可以看到我们要求的是系数b,差值a以及我们对应的x,y的平均数
- 用pandas读取文件
- 合并文件中的两个X,Y
- 求出x,y的平均数
- 带入求得方差
- 带入求得b
- 带